Известная компания DeepMind, принадлежащая корпорации Google и разрабатывающая приложения ИИ к различным областям жизни, на этот раз взялась за тексты. Ее ученые совместно с историками из университетов Греции, Англии и Италии создали нейронную сеть, способную анализировать большие объемы неполных текстов. Программу для разбора древнегреческих записей назвали «Итакой» по имени родного острова Одиссея, главного героя одноименного греческого эпоса; ее обучили на примере ста восьмидесяти тысячах сканов греческих текстов, в том числе отрывочных, из базы данных Гуманитарного института Паккарда в Лос-Алтосе, Калифорния. «Итаку» разработали девять ученых под руководством Яниса Ассаеля (Yannis Assael) и Теи Зоммерсшильд (Thea Sommerschield).
Результаты применения программы помогут историкам восстановить историческую справедливость. Она выдает вероятные способы заполнения пробелов древнегреческих тестов, наносит на географическую карту из восьмидесяти четырех регионов вероятности происхождения текста в каждом из них, а также строит временное распределение вероятности его создания с разбросом в несколько десятков лет. «Итака» восстанавливает поврежденные тексты с вероятностью 62% и с точностью 71% определяет места их происхождения. Проверка показала: если группа экспертов-историков правильно восстанавливает запись в 25% случаев, то совместно с программой они делают это в 72% случаев. То есть одной «Итаки» недостаточно для однозначного и окончательного воссоздания текста: последнее слово все равно останется за интеллектом исследователя.
Сейчас ученые адаптируют программу к другим древним текстам, к примеру написанным на иврите или языке индейцев майя. Код «Итаки» открыт, она доступна в Сети, запрета на ее модификацию нет. Поэтому программа сможет стать хорошим подспорьем для историков. И не только. Проницательный читатель заметит, что принципиально ничто не мешает использовать подобную разработку для восстановления, дешифровки и атрибуции любых текстов любых времен. Здесь открывается широчайшее поле деятельности для материнской транснациональной корпорации, которая обладает всеми исходными данными для активности такого рода.
(Nature, 9 марта 2022 года - полный текст)