Skip to content

Idea about new translator from English to Russian #1

@heavyweaponsguy11

Description

@heavyweaponsguy11

Hi! I saw you translator, and I really liked it! And after that I also had an idea to create new RBMT-system in Python, which would translate text from English to Russian based on rules and a dictionary. I think we can "exchange" grammar (You - English grammar, I - Russian grammar) to create a nice RBMT system like PROMT or Systran, and also develop a dictionary? What do you think?

I already have some idea, that we can create a few text files, called adverb.txt, verb.txt, noun.txt, etc. and then write in each file information about each word. For instance:
verb.txt
kill=убить=инфинитив=совершенный=переходной=нет_рода=нет_числа=нет_времени=нет_наклонения
kill=убил=глагол=совершенный=переходной=мужской_род=единственное=прошедшее=изъявительное
kill=убила=глагол=совершенный=переходной=женский_род=единственное=прошедшее=изъявительное
kill=убило=глагол=совершенный=переходной=средний_род=единственное=прошедшее=изъявительное
kill=убили=глагол=совершенный=переходной=нет_рода=множественное=будущее=изъявительное
kill=убью=глагол=совершенный=переходной=нет_рода=единственное=будущее=изъявительное
kill=убьём=глагол=совершенный=переходной=нет_рода=множественное=будущее=изъявительное
kill=убьёшь=глагол=совершенный=переходной=нет_рода=единственное=будущее=изъявительное
kill=убьёте=глагол=совершенный=переходной=нет_рода=множественное=будущее=изъявительное
kill=убьёт=глагол=совершенный=переходной=нет_рода=единственное=будущее=изъявительное
kill=убьют=глагол=совершенный=переходной=нет_рода=множественное=будущее=изъявительное
kill=убьём=глагол=совершенный=переходной=нет_рода=единственное=нет_времени=повелительное
kill=убьёмте=глагол=совершенный=переходной=нет_рода=множественное=нет_времени=повелительное
kill=убей=глагол=совершенный=переходной=нет_рода=единственное=нет_времени=повелительное
kill=убейте=глагол=совершенный=переходной=нетрода=множественное=нетвремени=повелительное
And we also need to develop rules - the most important thing in such sistems.
There I have 2 ideas:
First, get the words lemmas in English, then translate to Russian, and then agree on cases, gender, number, etc.
And second - just write rules like "if sentence have 'the', then after it should be noun....", etc.

Metadata

Metadata

Assignees

No one assigned

    Labels

    No labels
    No labels

    Projects

    No projects

    Milestone

    No milestone

    Relationships

    None yet

    Development

    No branches or pull requests

    Issue actions