A survey about machine translation of Turkic languages
Avrasya Uluslararası Araştırmalar Dergisi
ÖZET: Internet teknolojisinin geli?mesiyle, Internet destekli ortamlarda dosya yazmak ve geli?tirmek önemli i?levler olarak kabul edilmi?tir. Bu çe?it i?levler, imla düzeltmek, belli bir hecelerden sonra sözcükleri otomatik biçimde tamamlamak, sözcükleri bir dilden bir ba?ka dile bilgisayarlı aktarmak, dosyaların tümce yapısı ve kullanılan sözcüklerine göre içerik özetlemek ve analiz etmek gibi güncel ve önemli konuları kapsıyor. Sosyal ileti?im teknolojileri ve araçlarının geli?mesiyle, sürekli üretilen dosyaların analiz edilmesi ve farklı diller arasında aktarılması gün geçtikçe daha çok önem kazanıyor. ?nsan gücüyle bu çe?it çalı?maların hızlı ve doğru bir biçimde yapılması oldukça zordur. Bu nedenle, bilgisayar destekli dil ara?tırmaları önem kazanmı?tır ve yeni bilimsel çalı?ma alanı olan bili?imsel dilbilimi ?ekillenmi?tir. Türk dilleri ailesinde, Türkiye Türkçesi bili?imsel dilbilimi alanında en çok çalı?ılan dildir ve pek çok proje geli?tirilmi?tir. Diğer Türk dilleri ile ilgili bili?imsel dilibilimi çalı?maları henüz ba?langıç düzeyindedir. Bu makalede Türk dillerinin bazı önemli özellikleri açıklanmı?tır ve ?imdiye kadar yapılan bilgisayarlı aktarma ve doğal dil çalı?maları özetlenmi?tir. Tüm Türk dilleri, hatta diğer Altay dilleri arasında aktarma yapabilecek bir bilgisayarlı aktarma sisteminin geli?tirilmesi için, tüm Türk dilleri sözcüklerinin tek çe?it etiket ile i?aretlenmesi önerilmi?tir ve bu çe?it etiketlerin kullanılırlığı örnekler ile açıklanmı?tır.
ABSTRACT: With developing Internet technology, it becomes important tasks to write and edit documents through the Internet supported tools. In such tasks, spell checking, auto completing words after some syllables, machine translation of words from one language to another, content summarizing and analyzing according to words and sentence structure in a file, are considered popular and important topics. With improving social communication technology and devices, analyzing continuously produced documents and translation between different languages are becoming more important day after day. It is difficult to handle such task with manually without any error and with high speed. Because of these reasons, computer supported research languages come into prominence and a new filed, which is computational linguistic, formed in science. Turkish is one of the most computational researched language in Turkic language family and a lot of projects have been done. For other Turkic languages, computational researches are still at the beginning stage. This paper describes some main properties of the Turkic languages and summarize machine translations and natural language researches that have been done so far. A unique tagging system for Turkic word is suggested to implement a machine translations system between all Turkic languages, even between other Altaic languages. The usability of the unique tags is explained with examples.
Machine Translation, Turkic Languages, Turkish Grammar, Bilgisayarlı Aktarma, Türk Dilleri, Türkçe Gramer
Avrasya Uluslararası Araştırmalar Dergisi