22.12.2010 00:00
Аналитика.
Просмотров всего: 3820; сегодня: 1.

Технологии ABBYY помогают Институту востоковедения РАН в лингвистических исследованиях

Компания ABBYY, ведущий мировой разработчик программного обеспечения и поставщик услуг в области лингвистики, распознавания документов и ввода данных, объявляет об интеграции инструментария разработчика ABBYY FineReader Engine 9.0 с приложением, разработанным специалистами Института востоковедения РАН для внутренних нужд учреждения. Приложение используется для перевода в электронный вид бумажных документов на японском и китайском языках с целью их последующей лингвистической обработки. Технология ABBYY автоматизировала оцифровку текстов, избавив специалистов ИВ РАН от трудоёмкой работы по ручному вводу, и повысила точность вводимых данных.

Институт востоковедения РАН – академическое научное учреждение, ведущее фундаментальные исследования в области востоковедения. Научные изыскания института охватывают различные отрасли знания: историю, политику, экономику, религию, языки стран Ближнего и Дальнего Востока. Для решения ежедневных исследовательских задач ИВ РАН была необходима удобная встраиваемая технология распознавания, которая бы обеспечила тесную интеграцию процессов распознавания и верификации текстов с оригинальными процедурами лингвистического анализа, разработанными специалистами института. Решение ABBYY FineReader Engine 9.0 было выбрано как наиболее отвечающее потребностям ИВ РАН.

Теперь при обработке текстов на японском и китайском языках специалистам учреждения доступна широкая функциональность технологии ABBYY, в том числе инструменты коррекции отсканированного изображения для более качественного распознавания, функции анализа расположения блоков текста на странице и определения его ориентации. Также с помощью ABBYY FineReader Engine разработчикам ИВ РАН удалось реализовать удобный интерфейс верификации результатов распознавания. В процессе обработки текстов приложение строит гипотезы для неуверенно распознанных символов и предлагает их пользователю в виде контекстно-оптимизированных списков. Эта функция оказалась особенно полезна, учитывая сложность японского и китайского языков, отличающихся большим количеством символов, графической вариативностью, отсутствием чётко выраженных межсловных границ. В результате специалисты ИВ РАН добились заметного повышения точности распознавания текстов, при этом процесс оцифровки документов ускорился в несколько раз.

«Точное воспроизведение исходного документа в электронном виде необходимо для его корректного лингвистического анализа. Это особенно важно при оцифровке текстов, написанных идеографическим письмом, в котором отдельные символы обозначают не звуки, а целые слова или их значимые части. В таких случаях любая ошибка в распознавании может существенно исказить исходный смысл текста. С технологией ABBYY мы смогли перевести процесс оцифровки документов на японском и китайском языках на качественно новый уровень», – говорит Александр Костыркин, специалист Отдела языков и народов Азии ИВ РАН.


Ньюсмейкер: ABBYY — 211 публикаций
Поделиться:

Интересно:

325 лет назад Петр I издал указ о праздновании Нового года 1 января
20.12.2024 13:05 Аналитика
325 лет назад Петр I издал указ о праздновании Нового года 1 января
До конца XV века Новый год на Руси праздновали 1 марта. Эта точка отсчета была связана с тем, что в марте земля пробуждалась от зимнего "сна", начинался новый посевной сезон. С 1495 года Московский государь Иван III приказал перенести празднование Нового года на 1 сентября. Причин для...
19.12.2024 19:56 Интервью, мнения
Праздник к нам приходит: как поддержать атмосферу Нового Года в офисе
Конец года — самое жаркое время за все 12 месяцев, особенно для компаний. Нужно успеть закрыть все задачи, сдать отчёты, подготовить планы, стратегии и бюджеты. И, конечно же, не забывать про праздник, ведь должно же хоть что-то придавать смысл жизни в декабре, помимо годового бонуса.  Не...
Прозвища бумажных денег — разнообразные и многоликие
19.12.2024 18:17 Аналитика
Прозвища бумажных денег — разнообразные и многоликие
Мы часто даем прозвища не только знакомым людям и домашним питомцам, но и вещам, будь то автомобили, компьютеры, телефоны… Вдохновляемся цветом или формой, называем их человеческими именами и даем понять, что они принадлежат только нам и имеют для нас...
Советская военная контрразведка
19.12.2024 17:51 Аналитика
Советская военная контрразведка
Советская военная контрразведка появилась в годы Гражданской войны и неоднократно меняла свою подчиненность, входя то в структуру военного ведомства, то в госбезопасность. 30 мая 1918 г. учрежден первый орган военной контрразведки Красной армии – Военный контроль Оперативного отдела Народного...
Защитить самое ценное: История страхования в России
18.12.2024 13:22 Аналитика
Защитить самое ценное: История страхования в России
С давних времен человек стремится перехитрить свою судьбу. Люди желают знать, что будет, чтобы вовремя подготовиться к возможным перипетиям и обезопасить свое будущее. Вот только карты и гадалки в этом вопросе бессильны, куда надежнее справиться с рисками помогают...