Category: общество

Словарь от 8.0 на Андроиде

Мы выпустили версию 3.30 на Android - с версией словарных данных от ЯРКСИ 8. Так же, как и в таковой, там 5700 отредактированных словарных статей и ~6700 новых иероглифов из стандартов JIS0212/0213, которых в ЯРКСИ никогда раньше не было.

Новые кандзи пока что граждане второго сорта - чтения-значения не отредактированы, декомпозиции не заведены (то есть по элементам они не находятся), диаграмм начертания пока что тоже нет, из поля поиска они по умолчанию выключены. Над декомпозициями мы работаем, они вчерне готовы, но в этот релиз не попали.

Зато там такой зоопарк необычного... У нас раньше чемпионом по числу черт был иероглиф 驫 с 30 чертами. А в новом наборе есть кандзи 䯂, в который таковой входит в качестве элемента. А вот еще любопытный знак - 夨. Это пиктограмма, изображающая человека со склоненной головой, вполне себе иероглиф. По канонам, он пишется в три штриха, а ключ у него - 大, тоже три штриха. Это единственный известный нам случай, что ключ из иероглифа не выделяется без разрыва штриха. А вот 艹 - это какой-то вариант элемента "трава", судя по контексту, но такого тоже раньше мы не видели. И иероглифы с ним тоже имеются, это не единичный случай.

С чисто технической точки зрения, в новых кандзи есть около трех сотен знаков, не входящих в базовую плоскость Юникода (коды больше 0xFFFF). То есть если раньше ЯРКСИ мог смело предполагать, что все мыслимые строчки текста есть в кодировке UCS-2, теперь пришлось полноценно поддерживать UTF-16, с символами переменного размера. Так что данные данными, а код у меня тоже поплыл в ряде неожиданных мест.

Следующим номером будет аналогичное обновление на iOS.