Category: технологии

Словарь от 8.0 на Андроиде

Мы выпустили версию 3.30 на Android - с версией словарных данных от ЯРКСИ 8. Так же, как и в таковой, там 5700 отредактированных словарных статей и ~6700 новых иероглифов из стандартов JIS0212/0213, которых в ЯРКСИ никогда раньше не было.

Новые кандзи пока что граждане второго сорта - чтения-значения не отредактированы, декомпозиции не заведены (то есть по элементам они не находятся), диаграмм начертания пока что тоже нет, из поля поиска они по умолчанию выключены. Над декомпозициями мы работаем, они вчерне готовы, но в этот релиз не попали.

Зато там такой зоопарк необычного... У нас раньше чемпионом по числу черт был иероглиф 驫 с 30 чертами. А в новом наборе есть кандзи 䯂, в который таковой входит в качестве элемента. А вот еще любопытный знак - 夨. Это пиктограмма, изображающая человека со склоненной головой, вполне себе иероглиф. По канонам, он пишется в три штриха, а ключ у него - 大, тоже три штриха. Это единственный известный нам случай, что ключ из иероглифа не выделяется без разрыва штриха. А вот 艹 - это какой-то вариант элемента "трава", судя по контексту, но такого тоже раньше мы не видели. И иероглифы с ним тоже имеются, это не единичный случай.

С чисто технической точки зрения, в новых кандзи есть около трех сотен знаков, не входящих в базовую плоскость Юникода (коды больше 0xFFFF). То есть если раньше ЯРКСИ мог смело предполагать, что все мыслимые строчки текста есть в кодировке UCS-2, теперь пришлось полноценно поддерживать UTF-16, с символами переменного размера. Так что данные данными, а код у меня тоже поплыл в ряде неожиданных мест.

Следующим номером будет аналогичное обновление на iOS.

Андроид и лицензии

Мы опубликовали новую версию ЯРКСИ/Android, 3.21, с последней редакцией словаря. Но новость не в этом.

Мы пришли к выводу, что существующая лицензионная политика на ЯРКСИ/Android - 5 устройств на лицензию - не соответствует реалиям андроидной сцены, и решили её слегка пересмотреть. Теперь политика такая: 4 устройства на лицензию, и раз в год к счетчику прибавляется еще одно. Надеюсь, такой вариант уменьшит количество недовольства и обращений в техподдержку, которые вызваны зрелищем сообщения "лимит устройств исчерпан".

Политика применяется отчасти ретроактивно - у кого лицензия уже годы, тем система в субботу вечером накинула еще устройств к счетчику.

Вдобавок, мы расписали воможность получить по электронной почте справку о своей лицензии. Форма находится на контактной страничке ЯРКСИ/Android. Так что кто забыл код лицензии, тем туда.

Новая версия под iOS тоже готова, сейчас продирается через дебри сертификации в Apple. Через недельку, надеюсь, пройдёт.

Андроиду вдогонку

Вдогонку андроидному релизу 3.0 я выпустил 3.10. В основном там исправлены баги (в том числе любимый всеми виджет), кроме того, я туда включил обновление словаря. Теперь у нас 5400 отредактированных кандзи.

Явление с пустыми кунами в угадайке исправлено. Там был тонкий момент. У некоторых иероглифов имеются прочтения, которые формально есть он-чтения, но употребляются как отдельные слова (иногда с вспомогательным глаголом). К примеру, 急, 詩, 達する, 感じる. Вот эти иероглифы по ошибке попадали в угадайку по кунам, но логика отрисовки справедливо считала, что кунов у них нет и возвращала пустоту.

Теперь эти иероглифы будут втихую отсеиваться при подготовке угадайки. Он - это не кун, даже если он лексикализировался.

К слову, иероглифы без он-чтения тоже бывают. Это кокудзи, иероглифы, изобретенные в Японии, а не заимствованные из Китая. Канонический пример - 辻. Таковые в угадайку по он-чтениям аналогично не попадут.

формат базы и/или экспорт

Есть ли где-то описание формата базы данных кандзи и слов? возможно даже есть открытые фрагменты кода позволяющие выцепить нужную информацию или сгенерированный хтмл словарной статьи? (как минимум в андроид версии на сколько я понял статья форматируется именно через вебвью). С словами я практически полностью разобрался, а вот с кандзи сложнее. например как определить именно те кунные чтения которые отображаются в кандзи-дриле, угадайке и всплывающем окне при поиске через стандартный интент send? это все мне нужно для создания удобной колоды в anki так как инструменты обучения в яркси, без интервальных повторений, увы, никуда не годятся( а вообще функционал экспорта данных словарных статей "из коробки" был бы весьма кстати. хотя бы те же оны-куны-метки, а лучше более продвинутые и кастомизированные варианты с различной глубиной раскрытия значений

Рукописные иероглифы на Андроиде

Я выложил мажорную версию ЯРКСИ/Android - 2.0. С ней на Андроид пришло распознавание написанных пальцем на экране иероглифов, аналогично JiPad на ЯРКСИ-настольном.

По умолчанию включено поле для рисования, но сверху от него большая кнопка "К таблице", возвращающая нас к классическому интерфейсу. Кому что по душе. Возврат обратно - через меню.

Технология новая, обкатана не очень, так что возможны всякие нехорошие явления. В последующие дни я выложу, скорее всего, патч или даже несколько, потому что отчеты о нестабильной работе уже приходят.

Если распознавалка не распознает, или распознает не то, что надо, в самом низу меню есть команда "Пожаловаться на JiPad". Она отправляет в поддержку текущую картину поля для рисования, чтоб мы могли поглядеть, как она там обрабатывается.

Пользуйтеся на здоровье. Не стесняйтесь жаловаться.