機械翻訳

木 旧暦 6月19日 赤口 己巳 七赤金星 Lars V32 25020 日目

AI を使った翻訳の技術が進んでゐる。例へば英語とスウェーデン語の様にもともと似た構造の言語同士の翻訳であればかなり良い線まで行くと思ふ。実際、今のレベルでも相当役に立つことが多い。でも、日本語とその他の言語の間の翻訳は、いくら機械が深層学習を進めても到達できないレベルがあるだらうなと、僕は思ふ。例へばテレビの人気番組で、「ユーは何しに日本へ?」があるが、そのタイトルを英語で言へば ”Why did you come to Japan?” となるけれども、逆にこの英文から日本語に訳しようとすると、「あなたはなぜ日本へ来たのですか?」となるだらう。でも、「あなた」の部分を「君」にするか、「お前」にするか、「貴様」にするか、「あなた様」とするか、それとも「ユー」とするか、どれが一番良いかはその時の状況によるので話し手と聞き手の関係まで察しないといけない。また、「来たのですか」を省略しても文は成り立つ。その方がスッキリする場合もある。その様な例は枚挙にいとまがないと思ふ。「一人の男がこちらを見た」と「一人の男性がこちらに眼差しを向けた」では読み手の印象は変はる。将来の AI は敬語も正しく使ひこなすのかもしれないが、多くの人たちの言葉の使ひ方をデータとして取り入れて積み重ねて行くらしいので、誤用が多ければ間違った言ひ回しを学んでしまふことにもなる。古文の解釈はどうだらう。一般の日常会話にはでてこない言葉が多いので、データも集まらないのではないかと思ふが、それでも AI は古文の読解ができるのだらうか。「東ロボくん」は東大の入試にも受かるレベルを目指したと聞いた。秀才だからきっとできるのだらう。品詞分解などお手のものかもしれないな。意味までは教へてくれなくても、正確に品詞分解してくれて、単語ごとに「打ち消しの助動詞ずの連体形」などと教へてくれたらどんなに便利だらうなと思ふ。