Новое приложение искусственного интеллекта (ИИ), разработанное группой исследователей из Галле-Виттенбергского университета имени Мартина Лютера (MLU), Майнцского университета имени Иоганна Гутенберга и Университета прикладных наук Майнца, теперь способно расшифровывать трудночитаемые тексты на клинописных табличках.
Вместо фотографий система искусственного интеллекта использует 3D-модели табличек, что позволяет получать значительно более надежные результаты, чем предыдущие методы. Это позволяет проводить поиск по содержимому нескольких табличек и сравнивать их между собой. Это также открывает дорогу к совершенно новым исследовательским вопросам. Результаты исследования опубликованы в журнале The Eurographics Association.
Для нового подхода исследователи использовали 3D-модели около 2 тыс. клинописных табличек, в том числе около 50 из коллекции MLU. По оценкам специалистов, в мире сохранилось около 1 млн. таких табличек. Возраст многих из них превышает 5 тыс. лет, поэтому они являются одними из древнейших сохранившихся письменных документов человечества.
Они охватывают чрезвычайно широкий диапазон тем. «На них можно найти все: от списков покупок до судебных решений. Эти таблички позволяют заглянуть в прошлое человечества на несколько тысячелетий назад. Однако они сильно обветшали и поэтому трудно поддаются расшифровке даже для опытного глаза», — говорит доцент MLU Хуберт Мара.
Это объясняется тем, что клинописные таблички представляют собой необожженные куски глины, в которые вдавлены письмена. Усложняет ситуацию то, что письменность в то время была очень сложной и включала в себя несколько языков. Поэтому для правильного распознавания символов необходимы не только оптимальные условия освещения, но и значительные знания. «До сих пор было трудно получить доступ к содержимому многих клинописных табличек одновременно — нужно было точно знать, что и где искать», — добавляет Мара.
В его лаборатории возникла идея разработать систему искусственного интеллекта, основанную на 3D-моделях. Новая система расшифровывает символы лучше, чем предыдущие методы. В принципе, система искусственного интеллекта работает по тому же принципу, что и программное обеспечение OCR (оптическое распознавание символов), которое преобразует изображения надписей и текста в машиночитаемый текст.
Это имеет множество преимуществ. После преобразования в компьютерный текст его легче читать или искать. «Обычно OCR работает с фотографиями или сканами. Для чернил на бумаге или пергаменте это не проблема. Однако в случае с клинописными табличками дело обстоит сложнее, поскольку освещение и угол обзора существенно влияют на то, насколько хорошо удается распознать те или иные символы», — поясняет Эрнст Штётцнер из MLU. Он разработал новую систему искусственного интеллекта в рамках своей магистерской диссертации под руководством Хуберта Мара.
Команда обучала новое программное обеспечение ИИ, используя трехмерные сканы и дополнительные данные. Большая часть этих данных была предоставлена Университетом прикладных наук Майнца, который курирует крупный проект по изданию трехмерных моделей глиняных табличек. Впоследствии системе искусственного интеллекта удалось надежно распознать символы на табличках. «Мы были удивлены, обнаружив, что наша система хорошо работает даже с фотографиями, которые на самом деле являются более плохим исходным материалом», — говорит Штётцнер.
Работа исследователей из Галле и Майнца открывает новый доступ к материалу, который до сих пор был относительно эксклюзивным, и открывает множество новых направлений исследований. До сих пор это был лишь прототип, способный надежно различать символы двух языков. Однако всего известно двенадцать клинописных языков. В будущем программа может помочь расшифровать и выветрившиеся надписи, например, на кладбищах, которые, как и клинопись, являются трехмерными.