Japanese ChatGPT: この国が独自の AI を開発する主な理由

ChatGPT は日本人の期待を満たしていません。 システムは、この言語に存在する文字、精度、漢字に適応できませんでした。

ChatGPT の機能は多くの人を驚かせました, しかし、日本人はそれほどではないようです。 紹介されたチャットボット 日本語と日本文化に適応するのが非常に難しい政府、民間企業、そして世界最速のコンピューター「富岳」が、より良い結果をもたらす、あるいは可能性を秘めたインテリジェンスシステムを生み出す競争に参加しているのはこのためである。 ChatGPT日本語。

そこには 日本語の複雑さと文化の機微 として知られるこれらの人工知能システムの効果的な実装において課題が提示されました。 大規模言語モデル (LLM)。

私たちはこう提案します。なぜ私たちは広島や長崎には住めるのに、チェルノブイリには住めないのでしょうか。

日本語ChatGPTを構築する大型コンピュータ「富岳」

写真:ゲッティイメージズ

これらの課題に対応して、 具体的な開発が進行中です 人工知能テクノロジーを現地の言語とニーズに適応させます。 これには研究と 日本語に特化した言語モデルの開発。

に掲載された記事によると、 自然、 日本のスーパーコンピューター「富岳」もその開発に選ばれたものの1つだった を目的とした最も強力な言語プロセッサ 日本語ChatGPTを開発する。 このプロジェクトは、東京工業大学、富士通、理化学研究所研究センターグループによって支援されています。 結果が期待される オープンソースになり、来年利用可能になります。

日本では、Open AI の Chat GPT などの LLM が、 複雑さを理解できない そして言葉の繊細さ。 専門家らは次のように強調した。 日本語の文章構造は英語とは全く異なります。

文脈としては、 英語は26文字しかない、それは既存のテクノロジーが習得する言語です。 しかし、 日本語の書き言葉は、48 個の基本文字の 2 セットと 2,136 個の漢字で構成されます。 または常用漢字。 これらのほとんどは最後の 2 つ以上の発音であり、 追加漢字は約5万字 めったに使用されません。

このレベルの複雑さでは、次のようなことが起こるのは驚くべきことではありません。 ChatGPT には言語の問題がある可能性があります 参考文献から生成された回答を英語に翻訳するとき。 東北大学の坂口圭介研究員は、Open AI チャットボットは非常に珍しい文字や文字を生成することがあると説明しました。 その結果、人々が見たことのない奇妙な言葉が生まれます。

「GPT などの現在の公開 LLM は英語では優れていますが、アルファベット体系の違い、限られたデータ、その他の要因により、日本語では不十分なことがよくあります。」と彼は指摘しました。

こちらもお読みください: 東京地下大聖堂: 日本の都市を洪水から救う構造物

科学のための ChatGPT

国に利益を与える競争において 日本語のChatGPTにいくつかのグループが追加されました。 競合他社には次のようなものがあります。 テクノロジーの巨人 NECのスーパーコンピュータはもちろん、ソフトバンク、富岳、GPT本体も、 しかし、その第4世代です。

それで十分でない場合は、 日本も科学分野における生成知能の可能性を模索している。 文部科学省は、研究者のニーズに合わせたLLMに資金を提供しています。 すでに発表された結果から科学的仮説を生成することができます。

読み続けてください:

「神の工学」500年以上前、こうして日本に折り紙の伝統が生まれた

人工知能プログラムが 2,000 年前に失われたアレキサンダー大王の伝記を再構築

NASA、人工知能システムのおかげで 301 個の新しい系外惑星を発見

世界的な激しい論争の中、日本は福島への水を投棄し始める

lyon

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です