ИИ заполняет пробелы

Александр Гурьянов
(«ХиЖ», 2022, №4)

Известная компания DeepMind, принадлежащая корпорации Google и разрабатывающая приложения ИИ к различным областям жизни, на этот раз взялась за тексты. Ее ученые совместно с историками из университетов Греции, Англии и Италии создали нейронную сеть, способную анализировать большие объемы неполных текстов. Программу для разбора древнегреческих записей назвали «Итакой» по имени родного острова Одиссея, главного героя одноименного греческого эпоса; ее обучили на примере ста восьмидесяти тысячах сканов греческих текстов, в том числе отрывочных, из базы данных Гуманитарного института Паккарда в Лос-Алтосе, Калифорния. «Итаку» разработали девять ученых под руководством Яниса Ассаеля (Yannis Assael) и Теи Зоммерсшильд (Thea Sommerschield).

Результаты применения программы помогут историкам восстановить историческую справедливость. Она выдает вероятные способы заполнения пробелов древнегреческих тестов, наносит на географическую карту из восьмидесяти четырех регионов вероятности происхождения текста в каждом из них, а также строит временное распределение вероятности его создания с разбросом в несколько десятков лет. «Итака» восстанавливает поврежденные тексты с вероятностью 62% и с точностью 71% определяет места их происхождения. Проверка показала: если группа экспертов-историков правильно восстанавливает запись в 25% случаев, то совместно с программой они делают это в 72% случаев. То есть одной «Итаки» недостаточно для однозначного и окончательного воссоздания текста: последнее слово все равно останется за интеллектом исследователя.

Сейчас ученые адаптируют программу к другим древним текстам, к примеру написанным на иврите или языке индейцев майя. Код «Итаки» открыт, она доступна в Сети, запрета на ее модификацию нет. Поэтому программа сможет стать хорошим подспорьем для историков. И не только. Проницательный читатель заметит, что принципиально ничто не мешает использовать подобную разработку для восстановления, дешифровки и атрибуции любых текстов любых времен. Здесь открывается широчайшее поле деятельности для материнской транснациональной корпорации, которая обладает всеми исходными данными для активности такого рода.


(Nature, 9 марта 2022 года - полный текст)

Разные разности
08.12.2023
День Российской науки на COP28
День российской науки состоялся на площадке 28-й Конференции сторон Рамочной конвенции ООН об и...
04.12.2023
Грохот в океане
Сегодня мы очень много говорим о загрязнении Мирового океана пластиком. А о шумовом загрязнении как ...
30.11.2023
Памятник ржавчине
Каждый год коррозия съедает 10% всей произведенной за год стали. А то и больше. Разрушаютс...
25.11.2023
Берегите планету — ешьте руками
В Китае поставили цель сократить использование одноразовых столовых приборов при доставке еды и пров...