-
Notifications
You must be signed in to change notification settings - Fork 0
Description
Hi! I saw you translator, and I really liked it! And after that I also had an idea to create new RBMT-system in Python, which would translate text from English to Russian based on rules and a dictionary. I think we can "exchange" grammar (You - English grammar, I - Russian grammar) to create a nice RBMT system like PROMT or Systran, and also develop a dictionary? What do you think?
I already have some idea, that we can create a few text files, called adverb.txt, verb.txt, noun.txt, etc. and then write in each file information about each word. For instance:
verb.txt
kill=убить=инфинитив=совершенный=переходной=нет_рода=нет_числа=нет_времени=нет_наклонения
kill=убил=глагол=совершенный=переходной=мужской_род=единственное=прошедшее=изъявительное
kill=убила=глагол=совершенный=переходной=женский_род=единственное=прошедшее=изъявительное
kill=убило=глагол=совершенный=переходной=средний_род=единственное=прошедшее=изъявительное
kill=убили=глагол=совершенный=переходной=нет_рода=множественное=будущее=изъявительное
kill=убью=глагол=совершенный=переходной=нет_рода=единственное=будущее=изъявительное
kill=убьём=глагол=совершенный=переходной=нет_рода=множественное=будущее=изъявительное
kill=убьёшь=глагол=совершенный=переходной=нет_рода=единственное=будущее=изъявительное
kill=убьёте=глагол=совершенный=переходной=нет_рода=множественное=будущее=изъявительное
kill=убьёт=глагол=совершенный=переходной=нет_рода=единственное=будущее=изъявительное
kill=убьют=глагол=совершенный=переходной=нет_рода=множественное=будущее=изъявительное
kill=убьём=глагол=совершенный=переходной=нет_рода=единственное=нет_времени=повелительное
kill=убьёмте=глагол=совершенный=переходной=нет_рода=множественное=нет_времени=повелительное
kill=убей=глагол=совершенный=переходной=нет_рода=единственное=нет_времени=повелительное
kill=убейте=глагол=совершенный=переходной=нетрода=множественное=нетвремени=повелительное
And we also need to develop rules - the most important thing in such sistems.
There I have 2 ideas:
First, get the words lemmas in English, then translate to Russian, and then agree on cases, gender, number, etc.
And second - just write rules like "if sentence have 'the', then after it should be noun....", etc.