В период 1900–1916 годов только в Казани было издано 5 154 наименований татарских книг общим тиражом около 40 млн экземпляров В период 1900–1916 годов только в Казани было издано 5 154 наименования татарских книг общим тиражом около 40 млн экземпляров

В СЛУЧАЕ СО СТАРОТАТАРСКИМ ЯЗЫКОМ НЕВОЗМОЖНО СОЗДАТЬ ЕДИНЫЙ И ЧЕТКИЙ АЛГОРИТМ

Татарский народ обладает богатым письменным наследием. Не перечесть тех рукописных книг, которые вышли из-под пера татарских ученых и писателей. Большинство из них не дошло до наших дней, сгорело в пожарах, истлело от сырости в условиях нашего климата. Но по печатным изданиям уже можно назвать конкретные цифры. Например, в период 1900–1916 годов только в Казани было издано 5 154 наименования татарских книг общим тиражом около 40 млн экземпляров. В это же время в различных городах Российской империи выходило почти 100 наименований татарских газет и журналов. К сожалению, двойная смена алфавита отрезала нас от всего этого культурного богатства.

В Институте языка, литературы и искусства им. Ибрагимова АН РТ, ведущим научным сотрудником которого я являюсь, началась апробация компьютерной программы, которая поможет ввести в оборот хотя бы часть этого наследия. Ее рабочее название Miras-Tat, она умеет переводить старотатарские печатные источники сначала в арабицу, а потом в кириллицу. Говоря иначе, теперь любой желающий сможет читать на современном татарском шрифте старые, дореволюционные тексты. Если объяснить «на пальцах», то программа работает примерно так. В окно браузера загружается изображение страницы, например из журнала «Шура». Далее нажатием кнопки этот текст сканируется и автоматически переводится в печатный вид на арабице. Следующее действие транслитерирует полученный арабский текст на современную татарскую кириллицу.

Если объяснить «на пальцах», то программа работает примерно так. В окно браузера загружается изображение страницы, например, из журнала «Шура». Далее, нажатием кнопки этот текст сканируется и автоматически переводится в печатный вид на арабице Если объяснить «на пальцах», то программа работает примерно так. В окно браузера загружается изображение страницы, например из журнала «Шура». Далее нажатием кнопки этот текст сканируется и автоматически переводится в печатный вид на арабице

Просто? На первый взгляд, да.  Скептики сразу скажут, что в мире, дескать, уже есть подобные программы, что тот же Fine Reader прекрасно читает арабские тексты. Но это только так кажется. Особенность и сложность старотатарских текстов заключается в том, что вплоть до появления латиницы не существовало единого варианта передачи арабицей татарских звуков. Сам по себе арабский алфавит состоит исключительно из согласных звуков, часть из которых выполняет роль гласных. Например, характерный татарский звук «ә» в арабице передается как минимум тремя не похожими друг на друга графемами. Слово, оканчивающиеся на «ң» также может иметь на арабице несколько форм написания. Говоря иначе, в случае со старотатарским языком невозможно создать единый и четкий алгоритм.

Мозг новой программы состоит из тысяч секторов, в ячейки которых ученые вручную вбивали самые различные вариации прочтения тех или иных звуков, варианты аффиксов и окончаний. На все про все ушло два года работы, и на данном этапе Miras-Tat может распознавать и переводить на кириллицу старотатарские тексты с точностью до 70%. Это неплохой результат, но не идеальный. Программа самообучаема — по мере пополнения ее баз она становится совершеннее день ото дня. Это совместный проект программистов института, языковедов и специалистов по древним текстам. Первостепенная задача — довести точность распознавания на современной татарской кириллице до 100%. В перспективе эту программу можно расширить и доработать и в отношении других тюркских языков. 

Тот, кто не владел арабским письмом, теперь сможет напрямую обращаться к источникам Тот, кто не владел арабским письмом, теперь сможет напрямую обращаться к источникам

ЧТО КАСАЕТСЯ ДОРЕВОЛЮЦИОННЫХ ПЕЧАТНЫХ КНИГ, ТО ОНИ ТАКЖЕ ЛЕГКОДОСТУПНЫ ВСЕМ ЖЕЛАЮЩИМ

Что это дает нам в конечном результате? В первую очередь программа облегчает жизнь ученых-текстологов, литературоведов, историков. Тот, кто не владел арабским письмом, теперь сможет напрямую обращаться к источникам. Да и те, кто может читать на старотатарском, получит возможность работать эффективнее, быстрее. Впрочем, это касается не только ученых, но всех желающих. Большие перспективы открываются и в плане переиздания дореволюционных трудов татарских писателей и ученых, материалов периодической печати.

Вся эта работа ведется на базе центра письменного и музыкального наследия ИЯЛИ. Неофициально он называется «Мирасханэ», что в переводе с татарского обозначает «Дом наследия». Здесь находится около 50 тыс. единиц архивных материалов, так или иначе связанных с татарской культурой, с прошлым Татарстана, персональные фонды выдающихся деятелей татарстанской науки и культуры. Кроме того, здесь хранится более 8 тыс. рукописей, свыше 2 тыс. единиц старопечатных книг на арабской графике, шеджере-генеалогии, старые театральные афиши и много другого.

Ценной частью коллекции являются редкие рукописные источники, датируемые XIII–XIX веками. Среди них «Сахих аль-Бухари», рукопись «Нахдж ал-фарадис» Махмуда Булгари, рукописи Шигабутдина Марджани, подлинники рукописей, документов и фотографий классиков татарской литературы Габдуллы Тукая, Фатиха Амирхана, Галимджана Ибрагимова и т. д.

Программа по распознаванию старотатарского текста — это только один из проектов, которым занимается «Мирасханэ». Немало делается в плане оцифровки дореволюционных татарских газет и журналов. Уже сейчас можно не только свободно читать, но и бесплатно скачать в высоком качестве такие крупные и важные татарские издания начала ХХ века, как журнал «Шура», «Аң», газеты «Вакыт», «Йолдыз» и многие другие.

Ценной частью коллекции являются редкие рукописные источники, датируемые XIII–XIX веками Ценной частью коллекции являются редкие рукописные источники, датируемые XIII–XIX веками

Некоторые старые периодические издания можно уже сейчас прочитать в кириллице, например журнал «Аң» («Сознание»). Для этого надо пройти по ссылке и переключиться с кнопки «Оригинал» на кнопку «Перевод». Когда программа Miras-Tat будет окончательно готова, все это будет происходить автоматически. Но пока транслитерированные тексты на кириллицу подгружаются вручную. Вообще, сама работа по переводу с арабицы на современный татарский шрифт очень тяжела и кропотлива. Она требует знания не только татарского, но и арабского, староосманского и персидского языков. Если взять, к примеру, тот же журнал «Шура» («Совет»), то мы увидим, что почти наполовину он состоит из арабо-персидских заимствований. Ничего не поделаешь, такова была книжная традиция начала ХХ века. Для наших предков чтение прессы не представляло труда, для современного же читателя все это дремучий лес.

Тем не менее журнал «Шура», который издавался в 1908–1918 годы, — это кладезь знаний, богатейший источник информации о культурной, религиозной и повседневной жизни татар в начале ХХ века. Условно его можно сравнить с русской «Нивой», но намного серьезнее по своему содержанию, гораздо основательнее. На данный момент сотрудниками «Мирасханэ» на кириллицу переведены три годовые подшивки «Шура» (около 100 номеров). В ближайших планах издание этих текстов с комментариями отдельными томами на бумаге. К слову сказать, аналогичная работа ведется и по журналу «Аң» («Сознание»), газете «Йолдыз» («Звезда»).

Что касается дореволюционных печатных книг, то они также легкодоступны всем желающим. Любой может зайти и бесплатно скачать на сайте Miras.info татарские книги и рукописи конца XIX – начала ХХ века. Пока в свободный доступ выложено свыше 150 старопечатных и рукописных книг, но база постоянно пополняется. Вся эта работа также ведется силами небольшого коллектива центра, поэтому рассчитывать на большие объемы не стоит, хотя материала очень и очень много.

Во всем мире каталогизирование и оцифровка книг и рукописей воспринимается как возможность их сохранения для будущих поколений. У нас долгое время существовал тенденциозный подход к источникам на арабской графике. Многие из них дошли до нас в плачевном состоянии. Диджитализация — это один из инструментов сохранения наследия. Но задача «Мирасханэ» заключается не только в консервации, в том числе и электронной, а в предоставлении возможности всем желающим свободно и бесплатно знакомиться с богатым письменным татарским наследием. Понятно, что вся эта работа требует больших финансовых вливаний. Сотрудники центра получают отдельную помощь благодаря различным госпрограммам и грантам, но в основном вся работа ведется за счет текущего, очень скромного финансирования и здорового фанатизма.

В хранилище центра находится самая большая коллекция образцов татарского фольклора: более двух тысяч сюжетных и обрядовых песен, частушек, более тысячи текстов мунаджатов — религиозных песнопений, более шести тысяч народных песен и т. д. В хранилище центра находится самая большая коллекция образцов татарского фольклора. Есть фонограф Эдисона, предназначенный для их воспроизведений, но, к сожалению, он требует ремонта

ЭТО ОГРОМНОЕ БОГАТСТВО, КОТОРОЕ НЕ ДОЛЖНО ЛЕЖАТЬ МЕРТВЫМ ГРУЗОМ

Еще один большой проект, о котором надо сказать отдельно — это работа с татарскими эпиграфическими памятниками. Говоря иначе, это создание базы данных старинных татарских надмогильных камней, разбросанных по территории всей России и сопредельных стран. Только в Татарстане на сегодняшний день насчитывается 2 987 кладбищ, из них более 500 — исторических, на которых встречаются могилы не только XVIII–XIX, но даже XIII–XIV веков. В год сотрудники «Мирасханэ» совершают минимум по две экспедиции — одна по Татарстану, вторая по России — в места компактного проживания татарского населения. Также были проведены работы в Казахстане и Узбекистане. На место выезжает группа в составе 2-3 человек. На месте «прочесываются» подряд почти все кладбища, за исключением новых. Наиболее интересные по внешнему виду и содержанию камни и эпитафии фотографируются с большим разрешением со всех сторон, фиксируются координаты GPS, если надпись плохо читается, делается прорисовка. Позже, все эти данные будут внесены в электронную базу.

Для чего это нужно? Надписи на камнях практически не используются как источник, а информации они несут немало. Если взять эпитафии булгарского периода или времени Казанского ханства, то мы можем узнать много нового не только про конкретного усопшего, но и про исторические события, например о времени возникновения отдельных населенных пунктов. На камнях можно прочесть отрывки из древних поэм и повествований, которые не дошли до наших дней. Встречается немало назиданий, обращенных потомкам, завещаний отдельных людей. Кроме того, изучение эпитафий дает ученым возможность представить повседневную жизнь татар того времени, узнать среднюю продолжительность жизни, причины смерти того или иного человека, найти информацию о болезнях и эпидемиях в те давние времена. Говоря одним словом, это важный, достаточно информативный и достоверный источник, который раньше практически не использовался в научных исследованиях.

Впрочем, экспедиция — это сложная, но не самая трудоемкая часть работы. После возвращения все материалы обрабатываются и вносятся в общую базу данных. Если текст эпитафии на арабском, то он переводится на татарский и русский языки, дается его транскрипция, комментарии. Само изображение можно открыть и посмотреть в высоком разрешении, в том числе и в негативном отображении. Есть рубрикатор по населенным пунктам, по древности памятника, так что все желающие могут что-то найти о своих предках, родных и знакомых. Пока на сайте выложено около 150 описаний, но работа продолжается.

В хранилище центра находится самая большая коллекция образцов татарского фольклора: более 2 тыс. сюжетных и обрядовых песен, частушек, более тысячи текстов мунаджатов — религиозных песнопений, более 6 тыс. народных песен, записанных на магнитные ленты, т. д.

Среди музыкальных источников имеются самодельные металлические пластинки татарского музыкального мастера Гилязутдина Сайфуллина с записями татарских народных мелодий начала ХХ века. Всего их около 300. Он изготавливал звуковые носители сам, методом перфорирования металлических дисков по определенной, только ему известной, системе. Эти диски и сейчас находятся в отличном состоянии, их можно воспроизвести на аппарате «Стелла» или «Мира». Звучание получается бесподобным — по объемности и насыщенности звука эти диски дадут фору любым современным HD-проигрывателям. Неплохо бы было оцифровать эти диски — но это отдельный и дорогостоящий проект.

В «Мирасханэ» имеется еще около 40 восковых валиков с записями татарских мелодий конца XIX века. Возможно, там имеются голоса известных татарских деятелей, но прослушать их невозможно. Есть фонограф Эдисона, предназначенный для их воспроизведений, но, к сожалению, он требует ремонта. 

Это огромное богатство, которое не должно лежать мертвым грузом. Но оно и не лежит. Все, что имеется в фондах, постепенно изучается, обрабатывается, вводится в научный оборот. Главная задача — дать возможность всем желающим ознакомиться с этим бесценным культурным достоянием.