Japanese ChatGPT: この国が独自の AI を開発する主な理由

Posted On: 7月 13, 2024

ChatGPT は日本人の期待を満たしていません。システムは、この言語に存在する文字、精度、漢字に適応できませんでした。

ザ ChatGPT の機能は多くの人を驚かせました, しかし、日本人はそれほどではないようです。紹介されたチャットボット 日本語と日本文化に適応するのが非常に難しい政府、民間企業、そして世界最速のコンピューター「富岳」が、より良い結果をもたらす、あるいは可能性を秘めたインテリジェンスシステムを生み出す競争に参加しているのはこのためである。 ChatGPT日本語。

そこには 日本語の複雑さと文化の機微 として知られるこれらの人工知能システムの効果的な実装において課題が提示されました。 大規模言語モデル (LLM)。

私たちはこう提案します。なぜ私たちは広島や長崎には住めるのに、チェルノブイリには住めないのでしょうか。

日本語ChatGPTを構築する大型コンピュータ「富岳」

写真：ゲッティイメージズ

これらの課題に対応して、 具体的な開発が進行中です 人工知能テクノロジーを現地の言語とニーズに適応させます。これには研究と 日本語に特化した言語モデルの開発。

に掲載された記事によると、 自然、 日本のスーパーコンピューター「富岳」もその開発に選ばれたものの1つだった を目的とした最も強力な言語プロセッサ 日本語ChatGPTを開発する。このプロジェクトは、東京工業大学、富士通、理化学研究所研究センターグループによって支援されています。結果が期待される オープンソースになり、来年利用可能になります。

日本では、Open AI の Chat GPT などの LLM が、 複雑さを理解できない そして言葉の繊細さ。専門家らは次のように強調した。 日本語の文章構造は英語とは全く異なります。

文脈としては、 英語は26文字しかない、それは既存のテクノロジーが習得する言語です。しかし、 日本語の書き言葉は、48 個の基本文字の 2 セットと 2,136 個の漢字で構成されます。 または常用漢字。これらのほとんどは最後の 2 つ以上の発音であり、 追加漢字は約5万字 めったに使用されません。

このレベルの複雑さでは、次のようなことが起こるのは驚くべきことではありません。 ChatGPT には言語の問題がある可能性があります 参考文献から生成された回答を英語に翻訳するとき。東北大学の坂口圭介研究員は、Open AI チャットボットは非常に珍しい文字や文字を生成することがあると説明しました。 その結果、人々が見たことのない奇妙な言葉が生まれます。