Category: общество

Category was added automatically. Read all entries about "общество".

face

(no subject)

Миг вожделенный настал. Осушил бокал шампанского в честь Последнего Иероглифа. Завершен двадцатилетний лексикографический марафон.

В 2001 году (месяц и день не помню), следуя принятому решению разрабатывать свой словарь на оригинальной словарной базе, я вбил в компьютер данные для знака 亜, идущего первым в списке JIS X 0208. Мнилось, что работа над всеми 6355 иероглифами этого списка займет года два-три, максимум четыре — благо, черновые русские толкования к тому времени уже были вбиты командой волонтеров, собравшейся по моему зову. Однако дело оказалось куда сложнее. Через три года удалось вбить только первую половину, самые употребимые — после них пришлось переключиться на составные слова и функциональность самого приложения, а над толкованиями иероглифов работать урывками. Последнюю словарную статью, закрывающую список, для иероглифа 黌, я вбил в базу лишь сегодня. И сегодня же — так уж подгадал — отредактировал последнее черновое толкование японского слова, которых в базе около 70 тысяч. В моей жизни не было свершения более масштабного и значительного.

За эти двадцать лет я набил множество шишек, избавился от лишнего пиетета перед предшественниками и лексикографически заматерел. Горжусь длиннющим списком ошибок и неточностей, найденных мною в Большом Японско-Русском Словаре под редакцией самого Николая Конрада. Еще больше горжусь тем, что ЯРКСИ — даже с недоделанной словарной базой, полной черновых толкований — стал популярнейшим электронным словарем на всем постсоветском пространстве и де-факто стандартом для начинающих японистов. Знаю, что на многих востфаках его вполне официально рекомендуют преподаватели.

Второй бокал осушил за многолетнего партнера Всеволода Алексеева, который взял на себя разработку и поддержку мобильных версий словаря. Мы сделали их платными — это позволило проекту выжить и развиваться. Третий бокал пью за всех волонтеров, когда-то вбивавших черновые данные. Полтора десятка лет эти данные помогали не только мне, но и нескольким поколениям японистов, ибо тоже выводились в ЯРКСИ, пусть и серым шрифтом. Среди моих подписчиков на ФБ есть по крайней мере трое из этой старой команды. Примите мой поклон, друзья мои!

На этом, конечно, ничего не кончается. Есть еще дополнительный список иероглифов, совсем уж редчайших и неупотребимых, но все-таки существующих — в ЯРКСИ они уже включены, но снабжены лишь черновыми английскими толкованиями. Думаю взяться и за них, хотя едва ли осилю все, ведь этот список еще длиннее. Что же до слов, то слова точно будут добавляться. Равно как и новая функциональность.

Печалит одно: мечталось покорить не только постсоветское пространство, но и мир — однако брат-близнец ЯРКСИ, японско-английский словарь JiShop покамест не обрел и десятой доли такого признания. Но и эта мечта не отринута. Всё возможно.

Версия ЯРКСИ 8.4 для Windows с полностью отредактированной словарной базой выйдет в ближайшие дни.

  • sevaa

Голосуем за Саяку-сан!

В Windows 10 имеется встроенный синтез речи, в том числе японской (ставится в Настройках). Там три японских голоса - Аюми, Харука и Итиро. Но есть и четвертый, Саяка. Он в системе вроде как есть, но в списке не значится. Пользователи-администраторы и специальным образом написанные программы могут до Саяки достучаться, но вообще-то это косяк Microsoft.

Кому обидно за девушку-робота - пройдите по ссылке https://developercommunity.visualstudio.com/content/idea/948724/support-for-sapi-54-onecore.html и поставьте плюсик, если не трудно. Дружно голосуем за Саяку-сан!

UPD: теперь надо бы сделать анимированную видюшку, чтобы ей гражданство в Windows дали. Она сама и озвучит. А Итиро, Харука и Аюми будут второстепенными персонажами. Идеи у кого есть?
  • sevaa

Словарь от 8.0 на Андроиде

Мы выпустили версию 3.30 на Android - с версией словарных данных от ЯРКСИ 8. Так же, как и в таковой, там 5700 отредактированных словарных статей и ~6700 новых иероглифов из стандартов JIS0212/0213, которых в ЯРКСИ никогда раньше не было.

Новые кандзи пока что граждане второго сорта - чтения-значения не отредактированы, декомпозиции не заведены (то есть по элементам они не находятся), диаграмм начертания пока что тоже нет, из поля поиска они по умолчанию выключены. Над декомпозициями мы работаем, они вчерне готовы, но в этот релиз не попали.

Зато там такой зоопарк необычного... У нас раньше чемпионом по числу черт был иероглиф 驫 с 30 чертами. А в новом наборе есть кандзи 䯂, в который таковой входит в качестве элемента. А вот еще любопытный знак - 夨. Это пиктограмма, изображающая человека со склоненной головой, вполне себе иероглиф. По канонам, он пишется в три штриха, а ключ у него - 大, тоже три штриха. Это единственный известный нам случай, что ключ из иероглифа не выделяется без разрыва штриха. А вот 艹 - это какой-то вариант элемента "трава", судя по контексту, но такого тоже раньше мы не видели. И иероглифы с ним тоже имеются, это не единичный случай.

С чисто технической точки зрения, в новых кандзи есть около трех сотен знаков, не входящих в базовую плоскость Юникода (коды больше 0xFFFF). То есть если раньше ЯРКСИ мог смело предполагать, что все мыслимые строчки текста есть в кодировке UCS-2, теперь пришлось полноценно поддерживать UTF-16, с символами переменного размера. Так что данные данными, а код у меня тоже поплыл в ряде неожиданных мест.

Следующим номером будет аналогичное обновление на iOS.
Zett
  • z_kir

如かず

Уважаемый Вадим!

如かず -- Яркси дает перевод "быть лучше, превосходить". Это разве правильно?

Jishou дает перевод "being inferior to; being no match for"

и примеры:

百聞は一見に如かず
三十六計逃げるに如かず

Судя по примерам, правильнее все же "Быть хуже, не идти в сравнение".
face

Ошибки в БЯРСе - 2

Продолжается работа над словарной базой ЯРКСИ - а значит, пополняется список выявленных ошибок и неточностей в различных бумажных словарях; прежде всего - в Большом Японско-Русском Словаре под редакцией академика Конрада (сетевая версия известна как «Вародай»). Первую порцию этого списка я выкладывал в этом сообществе в мае 2012 года. Очень признателен юзеру van_kabumoto, который добровольно взял на себя роль адвоката БЯРСа и на пару со мной устроил в комментариях многомесячный состязательный процесс (я, понятное дело, выступал прокурором). В ходе дебатов многое уточнилось и утряслось; в некоторых случаях защитнику даже удалось убедить меня в несправедливости моей критики.

Выкладываю сегодня новую порцию исправлений и замечаний.

     «Хатомуги» – не «перловая крупа», а растение «буссеник, иовлевы слёзы» (в перловой крупе, скорее всего, виновато английское толкование Pearl Barley)
     «Амадзакэ» нельзя называть «сладким сакэ», это самостоятельный напиток, который может быть вообще безалкогольным.
     «Акубё:до:» – не «равенство на словах», а «уравниловка». Здесь, похоже, не обошлось без идеологических помех. Кстати, в словаре Лаврентьева правильно.
     «Тицу» - «картонная корка (для книг)». Какая еще «корка»? Футляр!
     «Намагусабо:дзу» – «дрянной поп». Называть буддийского монаха «попом» - это как-то чересчур. В ЯРКСИ – «распутный монах».
     «Инэкакэ» 稲掛け. БЯРС толкует это слово как «копну сжатого риса». Но, во-первых, в копнах бывает только сено или солома. Рис собирают в снопы. Во-вторых, все японские словари едины в том, что словом «инакакэ» обозначается не сам рис, а деревяннные козлы, на которых рисовые снопы развешивают для просушки. Кстати, синонимичное слово 稲木 «инаги» (которого нет ни в БЯРСе, ни в Кэнкюся) представляется, как минимум, не менее употребимым.
     «Нэдзуми-но ёмэири» («Мышиная свадьба») - название сказки. В переносном смысле это вовсе не обязательно означает «равный брак». Это более широкая метафора того, как люди после долгих и амбициозных метаний приходят к заурядному итогу. Второе упомянутое БЯРСом значение («грибной дождь»; также в EDICT – “light shower”) не находит подтверждения в японских источниках средней размерности.
Collapse )
face

Ошибки в БЯРСе

В ходе работы над словарной базой ЯРКСИ мне постоянно приходится сличать толкования, которые дают японским словам различные источники, и нередко обнаруживать в этих источниках какую-либо ошибку или неточность. С некоторого времени я взял за правило вести списки таких ошибок. Сейчас у меня есть списки для японско-английского словаря Кэнкюся, иероглифических словарей Фельдман-Конрад, Гальперна и Спана&Хадамицкого. Даже есть скромный список ошибок Кодзиэна! Но самый длинный и постоянно растущий список относится к Большому Японско-Русскому Словарю под редакцией академика Конрада (БЯРС). Должен сказать, что я давно уже не разделяю пиетета, который многие отечественные японисты питают к этому лексикографическому труду - возникшему в свое время как русифицированная версия все того же японско-английского словаря Кэнкюся. Слишком уж много в нем встречается ляпов, небрежности и откровенной халтуры.

С другой стороны, БЯРС действительно является крупнейшим из доселе созданных японско-русских словарей; серьезных ему конкурентов по объему и глубине толкований пока не видно. Поэтому я от души приветствовал появление онлайновой версии БЯРСа, а копящиеся у меня списки ошибок пересылаю его разработчикам. Пусть он станет хоть немножко лучше.

В предыдущей записи речь шла о моих замечаниях к толкованию слова "о:рора" ("утренняя заря" по БЯРСу и "полярное сияние" в действительности). С юзером van_kabumoto мы договорились, что я выложу очередную порцию ошибок из моего списка прямо здесь. Вот она, эта порция:

«Тайхося» - не «арестовывающий», а «арестованный».
«Камбуцуэ» - годовщина не смерти Будды, а его рождения.
«Дзуми» - не «кизил», а «яблоня торинго»
«Мидзуки» - истолковано как «дерен», но правильнее будет как раз «кизил»
«Нитиун» - не «солнечная корона», а «гало» (то же для слова «каса»)
«Оикоси» - не «переход», а «обгон»
«Суиттибакку» - не «американские горы», а «железнодорожный серпантин».
«Бо:нэнкай» - не «встреча Нового года», а «проводы старого года» (у Лаврентьева правильно)
«Сандантоби» - не «три фазы прыжка», а «тройной прыжок» (у Лаврентьева правильно)
«Тэйсёку» - не «регулярное питание», а «комплексный обед» (у Лаврентьева правильно)
«Гуми» - не «морской огурец», а «дикая маслина».

Collapse )