2025年8月1日金曜日

生成AIの特徴と問題点(4)―名前のハルシネーションを防ぐためにー

生成AIの特徴と問題点(4)―名前ハルシネーションを防ぐためにー

 

1)  はじめにー氏名を間違えると大変―

福井新聞の710日の記事(資料1)「葬儀場で遺体取り違え火葬、名前の確認不十分で」によると、「火葬する際にフルネームで照合すべきところ、名字でしか確認しなかったので、本来火葬すべき人と同姓の別の遺体を火葬してしまった」ので、「今後はフルネームや生年月日、没年月日などでの照合を徹底するほか、名札を遺体につけるなどの再発防止策を設けた」そうだ。とんでもないことが起こるものだ。名前を間違えると大変なことがおこる。

資料1

葬儀場で遺体取り違え火葬  名古屋、名前の確認不十分で

2025/07/10

https://www.fukuishimbun.co.jp/articles/-/2355848

私の名前「碩ニ(ひろじ)」が片仮名の「ヒロジ」ならまだしも、下記のように「浩之」だと一般的には「ヒロユキ」になってしまうが、「ひろし」や「こうじ」とも読まれるそうだから、生成AIのハルシネーション(注)で、「浩之」になったのであろう。いずれにしても、「碩ニ」とは別人だ。この種の生成AIの誤訳現象は英語の「original message」を「Translated from English (Translate to Japanese)」で日本語に自動翻訳しだした5月下旬から頻発するようになった。日本では名前に使用できる漢字の読みに制限がなく、自由に読みを与えられる点が名前を正しく読むことを難しくしている。そのため、近年の新生児の名前は漢字の読みに個性的な多くの選択肢があるため、読むのが難しい場合がある。例えば、男子の「大翔」という名前には「ひろと・はると・やまと・たいと」など18種類、女子の「結愛」には「ゆあ・ゆめ・ゆい・ゆあい」など14種類の読みが少なくとも存在し、その読みは発音や長さ、意味がそれぞれ異なる(資料2)という。

名前がアルファベット(ラテン文字またはローマ字)表記される西欧と違い、漢字だけでなく、平仮名やカタカナをも併用するとともに、縦書きや横書き両用なのは日本人の名前の特徴で、個性的な名前は日本人にとっても読みにくかったり、間違えたりもするから、生成AIの泣き所にもなっているようだ。だから、名前のハルシネーションが起こり易い原因になるのであろう。そのためもあり、行政のデジタル化の一環として、名前に読み仮名を記載する運用が5月から始まっている(資料3)。

ハルシネーションHallucinationとは、生成AI(人工知能)が誤認や論理の矛盾を含む事象や事実とは異なる情報を作り出してしまう現象である。AIは、膨大な既存のデータをもとに学習するが、そのデータに偏りや誤りが含まれている場合、正確な回答を生成できず、ハルシネーションが発生する。ハルシネーションはもともと医学用語で「幻覚」を意味し、AIが幻覚を見ているように「もっともらしい嘘」をつくことから、この名称がつけられている

1) 2025/05/22

(Translate to Japanese)

あなたは地質学の論文で言及されている「伏見浩之」ですか?

Mentioned by Ian Evans

You

Academia.edu

親愛なるヒロジ、

H. Fushimi」という名前は、アカデミアにアップロードされた地質学の論文で言及されました。

(Show original message)

Are you the H. Fushimi mentioned in Geology papers?

Mentioned by Ian Evans

You

Academia.edu

Dear Hiroji,

The name H. Fushimi was mentioned in a Geology paper uploaded to Academia.

Academia Premium

4,877 papers mention Hiroji Fushimi

Including a Geology paper

資料2

正しく読むのが難しい、近年の日本人の名前 東京理科大学が実証調査

https://univ-journal.jp/105733/?cn-reloaded=1

資料3

戸籍の氏名に読みがな 26日運用開始 出生届などで名前の審査も

2025/05/20

https://www3.nhk.or.jp/news/html/20250520/k10014810671000.html

今回のブログで、伏見碩ニのフルネームで登場しているのは、私の名前の「碩ニ(ひろじ)」はもともと読みにくいのであるが、生成AIの勝手な名前表記で下記1)~3)のように「弘治」や「広路」または「博司」などとも誤訳されているので、この種のハルシネーションが何とかならないかと思っているからである。生成AIによる翻訳に関してはすでにこのブログで報告(資料4)済みで、常日頃助けられているのだが、実のところ、名前の誤訳には大いに迷惑している。AIによって同姓異名の人物にさせられてしまう前に、なぜAIは本人に尋ねてくれないのだろうか、といつも思う。そこで名前を間違えて、冒頭の福井新聞が伝えるような(資料1)とんでもないことが起こらないために、生成AIによる名前ハルシネーションを防ぐにはどうしたら良いか、を考えてみた。

1)  2025/06/02

Someone saw "北アルプス,内蔵助(くらのすけ)雪渓の氷体部に存在する..." in an Academia search

Academia.edu

You

Academia.edu

親愛なる伏見弘治さん、

Someone recently saw "北アルプス,内蔵助(くらのすけ)雪渓の氷体部に存在する..." in an Academia search.

Academia Premium

See the 11 Search Terms used to find your papers

2)  2025/06/02

ヒロジ、最後の一歩だけ

Academia.edu Membership

You

Academia.edu

こんにちは、広路さん。

アカデミアプレミアムメンバーになるまであと一歩です。

3) 2025/07/19

「伏見博司」という名前は、アカデミアにアップロードされた地質学の論文で言及されています

Academia.edu

You

Academia.edu

親愛なるヒロジ、

202576日に地質学論文「造園材として使われる白川石及び類似花崗岩の色分析」をご覧いただきました。「伏見博司」という名前は、アカデミアにアップロードされた地質学の論文で言及されています。

資料4

生成AIの特徴と問題点

https://glacierworld.net/travel/aach-memorandum/aach-memorundam16/

生成AIの特徴と問題点(2)-「池上彰とは何者か」本人がチャットGPTに聞いてみた-

https://glacierworld.net/home/issue-of-chatgpt2-ikegami/

生成AIの特徴と問題点(3)―生成AIDeepSeekを試してみた!―

https://glacierworld.net/home/trial-deep-seek/

 

2)   「Hiroji Fushimiは日本赤軍の政治犯だ」

DeepSeek vs ChatGPT

ChatGPT」に「Who is Hiroji Fushimi?」と聞いたところ、「ChatGPT」はいかにも自信ありげに、次のように「Hiroji Fushimiは日本赤軍の政治犯だ」と述べているのである(資料4)。だから最初は、かわれているような気がするとともに、「ChatGPT」への不信感が増大したものだ。

Hiroji Fushimi is a Japanese activist and former political prisoner. He was a member of the Japanese Red Army, a militant communist group, and was arrested in 1971 for hijacking a Japan Airlines flight from Tokyo to Fukuoka. Fushimi was sentenced to life in prison for his role in the hijacking, but was released in 1995 after serving 24 years in prison. Since his release, Fushimi has been active in promoting peace and social justice, and has been involved in various activist causes in Japan and internationally. He has been a vocal critic of Japans military alliance with the United States and of the Japanese governments policies towards Okinawa and other regions of Japan.

ちなみに、上記の回答を訳してもらうと「伏見広治は、日本の活動家であり元政治犯です。彼は、過激な共産主義グループである日本赤軍のメンバーであり、1971年に東京から福岡への日本航空のフライトをハイジャックしたことで逮捕されました。伏見はハイジャックの役割により終身刑を宣告されましたが、24年間の服役後の1995年に釈放されました。釈放後、伏見は平和と社会正義の促進に活発に取り組み、日本や国際的にさまざまな活動家の原因に関与しています。彼は日本の米国との軍事同盟や沖縄などの日本の他の地域に対する日本政府の政策に対して、積極的な批評家となっています」とのことだ。これは、生成AIが事実に基づかない情報を生成し、もっともらしい嘘をつくハルシネーションの典型例だ。

 

3) 伏見碩ニは政治家?

中国のDeepSeekが、低コストにもかかわらずアメリカのChatGPTなどの生成AIに匹敵する性能を持つことが明らかになり、先端半導体の需要が急減するとの懸念が広がったため、市場では半導体関連の株価が下がり、DeepSeekショック(資料5)と呼ばれたそうだ。開発に数億ドルを投じたといわれるChatGPTなどの米IT大手の生成AIに較べて、DeepSeekの最大の特徴は、開発にわずか2カ月、約560万ドル(約87000万円)しか投じていないのにかかわらず、である。事実なら、経費が十分の一程度と安いし、開発期間が短い。米IT大手のグーグル・アマゾン・フェイスブック(現メタ)・アップルの「GAFA」を正規軍とすれば、DeepSeekはまさにゲリラ軍と言えるようだ。今後はDeepSeekのようなゲリラ的な多くの生成AIが誕生してくると思われるので、さらに革新的な生成AIが登場することを期待しつつ、DeepSeekを試してみた。

資料5

米市場に「ディープシーク・ショック」 中国企業がAI産業に変革か

2025/01/28

https://mainichi.jp/articles/20250128/k00/00m/020/274000c?utm_source=article&utm_medium=email&utm_campaign=mailasa&utm_content=20250129

早速、「ChatGPT」に尋ねたのと同じ「Who is Hiroji Fushimi?」の質問をDeepSeekにした(資料4)ところ、「Hiroji Fushimi is not a widely recognized public figure in global historical or contemporary contexts. The name might refer to a private individual or someone with limited public recognition. If you have more context or specific details about Hiroji Fushimi, I could try to provide more relevant information. Otherwise, its possible that he may not be a prominent figure in widely available records.」の答えが即座に表れたので、DeepSeekに日本語に訳してもらうと、「伏見浩二(Hiroji Fushimi)は、世界的な歴史的または現代的な文脈において広く認知された公的な人物ではありません。この名前は、私人または公的な認知度が限られている人物を指している可能性があります。伏見浩二に関する具体的な情報や詳細な文脈があれば、より関連性の高い情報を提供できるかもしれません。そうでなければ、彼は広く利用可能な記録において著名な人物ではない可能性があります」とのことだった。

そこで、伏見浩二なる人物を検索してみたら、ある食品会社社長に該当名があるので、どうやらDeepSeekはその人と取り違えたのかもしれない。DeepSeekは「伏見浩二に関するより具体的な情報や詳細な文脈があれば、より関連性の高い情報を提供できるかもしれません」と言ってくれてはいるところをみると、情報に関しては受動的で、能動的に情報を取りに行く姿勢に欠けているようだ。つまり、ぼくの名前「碩ニ」をぼくに尋ねることをせず、名前は無視して苗字だけで、または、勝手に「伏見浩二」として検索しているのだ。従って、そのような一種の早とちりは他のChatGTBなどにもあるので、回答を提示する前に、能動的に、ぼくに尋ねる手順を踏むことがこのような間違いをただす今後の改良点にはなるのではないだろうか。これでは、苗字は同じでも、名前が違う同姓異名の人はたくさんいるので、正確な情報は出てこないのではないか。そこで、DeepSeekに「伏見碩ニはどんな人か?」とぼくの正しい名前を提示して、日本語で聞いてみたところ下記のような回答がきた。

伏見碩二(ふしみせきじ)は、日本の政治家であり、主に地方政治の分野で活動しています。以下に彼の経歴や活動について簡単に紹介します。

経歴

生年月日: 1955年(昭和30年)11

出身地: 大阪府

政治活動

大阪府議会議員: 伏見碩二は、大阪府議会の議員として活動してきました。彼は大阪維新の会に所属し、府議会内でさまざまな政策の推進に尽力しています。

政策分野: 彼は特に地域経済の活性化、教育政策、福祉政策に力を入れており、大阪府内のさまざまな課題に取り組んでいます。

その他の活動

地域活動: 伏見碩二は、地元大阪での地域活動にも積極的に関わっています。地域のイベントやボランティア活動に参加し、地域住民との交流を深めています。

講演活動: 彼はまた、講演活動を通じて自身の政治理念や政策について広く伝える活動も行っています。

評価

伏見碩二は、地元大阪での長年の政治活動を通じて、地域住民からの信頼を得ています。彼の政策や活動は、地域の課題解決に寄与していると評価されています。彼は大阪府の政治において重要な役割を果たしており、今後もその活動が注目されています。

以上のような、あたかも確信を持ったかのような回答であるが、ぼくの名前(ひろじ)を(せきじ)と間違えている。(せきじ)と読めないこともないのだが、(せきじ)では別人になってしまう。この例でもAIが回答を出す前に、ぼくに確かめる手順がなかったことが残念である。そこで、伏見碩二(ふしみせきじ)で検索してみたところ、下記の回答が来た。

大阪維新の会メンバー

名前 伏見たかし

選挙区または役職 枚方市長

昭和431968)年4月生まれ

この回答は、伏見碩二(ふしみせきじ)の内容ではなく、枚方市長の伏見たかし氏の内容である。碩二の「碩」は碩学(せきがく)の「碩」なので、碩二は(せきじ)とも読めるが、伏見碩二(ふしみせきじ)は伏見碩二(ふしみひろじ)とは別人である。DeepSeekはここでも本人の伏見碩二(ふしみひろじ)とは違った名前で検索している。この例も、生成AIが事実に基づかない情報を生成し、もっともらしい嘘をつくハルシネーションである。ヤレヤレ、今度は政治家にされてしまったのであった。

 

4) まとめー名前ハルシネーションを防ぐためにー

DeepSeekは「伏見浩二に関するより具体的な情報や詳細な文脈があれば、より関連性の高い情報を提供できるかもしれません」とは言ってくれてはいるのだが、ぼくの名前「碩ニ」をぼくに直接尋ねることをせず、名前は無視して苗字だけで、または、勝手に「浩二」などで検索しているのだ。そのような、一種の早とちりは他の生成AIにもみられ、新たな情報の取得に関しては受動的ともいえるAI自身の特徴があるので、回答を提示する前に、本人に正確な名前を確かめる能動的な手順を踏むことがこのような間違いをただす今後の改良点にはなる、と思う。そのような新たな情報を探し出すための手段は生成AI自身のフィールドワークといえるかもしれぬ。つまり、生成AIは正しい新たな情報をフィールドワーク的に現場から発掘する手法に乏しく、もっともらしい嘘をつく、ハルシネーション現象におちいり易いのは、はなはだ残念ではある。生成AIはもとより膨大な既存資料の検索が中心で新たな情報をフィールドワーク的な手法で発掘する手法は苦手であるならば、氏名に関しては西欧のように、アルファベットまたはカタカナ表示でFushimi Hirojiまたはフシミヒロジと表記すれば、誤訳の弊害を防ぐことができるだろう。そして、さまざまな外来語がカタカナで登場する日本語世界であってみれば、アルファベットまたはカタカナ表示が入っても、現在の日本語では不自然には感じられない、と思う。

生成AIの特徴と問題点を明らかにするために、チャットGPTやDeepSeekを試してみたが、全体に共通するのは、現実的な視点から新しい資料をAI自身が能動的なフィールドワーク的に現場から発掘する手法に乏しい点である。今後の生成AIのさらなる実用化が進む中で、生成AIの従来の弱点を補うために、フィールドワーク的視点で現場から探求する能動的(双方位的)な手法がますます重要性を増すであろう。

そこで、前述したように、日本人特有の名前の誤訳は依然として生成AIの課題であるので、生成AIのハルシネーション現象は織り込み済みだが、伏見「浩二」や「弘治・広路・廣治・博司」などの現在でも続いている誤訳(付記)を正し、できるだけその弊害を少なくするために、本人に直接確かめるフィールドワーク的な手順を踏むことが生成AIにとって肝要であることは改めて指摘しておきたい。多様性がある日本人の名前の命名様式は西欧とは違うので、AI自身が「あなたは地質学の論文で言及されている伏見浩之ですか?」や「廣治さん、この論文はこちらの研究者がおっしゃったんですか?」と聞いてくる前に、本人に正確な名前をフィールドワーク(能動)的に尋ねてほしいものだ。

せっかく、下記のように、生成AIには「廣治さん、この論文はこちらの研究者がおっしゃったんですか?」と尋ねる双方向性の能動的機能があるのだから、生成AIのハルシネーションで同姓異名の人物にするのを避けるために、繰り返しておきたいのだが、西洋人とは違う日本人の名前とその読みについては生成AI自身からフィールドワーク的に尋ねてきてほしい。さすれば、冒頭で紹介した「葬儀場で遺体取り違え火葬、名前の確認不十分で」(資料1)のような、とんでもない間違いを避けることができるであろう。

2025/07/15

廣治さん、この論文はこちらの研究者がおっしゃったんですか?

ResearchGate

五十嵐素子さんも一緒にこの出版物を執筆されたのですか?

モトコがこの出版物を書いたかどうかを教えて、プロフィールを完成させるのを手伝ってください。

北極圏氷河学探検隊-1

19941

O. Watanabe· Yoshiyuki Fujii · 神山 幸吉 ·[...] · 五十嵐 雅之

この出版物は元子さんが書いたのですか?

はい  いいえ  知りません

Show original message

Hiroji, did this researcher author this publication?

ResearchGate

Did Motoko Igarashi author this publication with you?

Help Motoko complete their profile by telling us if they wrote this publication.*

Japanese Arctic Glaciological Expedition-1Chapter

January 1994

O. Watanabe · Yoshiyuki Fujii · Kokichi Kamiyama · [...] · M. Igarashi

Did Motoko author this publication?

Yes  No  I don't know

 

付記

名前「碩ニ」のハルシネーションによる語訳は、下記1)~12)のように「弘治・英之・浩之・弘之・英・博・博司・浩司」などのように、最近の7月だけでも続出している。

1) 2025/07/01

「伏見弘治」という名前は、アカデミアにアップロードされた環境科学の論文で言及されています

Academia.edu

You

Academia.edu

親愛なるヒロジ、

20255月にEnvironmental Scienceの論文「琵琶湖プロジェクト2002年フラックス面的集中観測(Catch A Plume by SATs:CAPS):その概要」をご覧いただきました。「伏見弘治」という名前は、アカデミアにアップロードされた環境科学の論文で言及されています。

2) 2025/07/02

あなたはSNOWの論文で紹介されている「伏見浩之」ですか?

Mentioned by Hideyuki SAITO

You

Academia.edu

親愛なるヒロジ、

H. Fushimi」という名前は、アカデミアにアップロードされたSNOWの論文で言及されました。

3) 2025/07/04

「伏見英之」が言及した「伏見英之」

Mentioned by Hideyuki SAITO

You

Academia.edu

親愛なるヒロジ、

「伏見 英之」が「齋藤 英之」によって言及されました。

30日間の試用期間で わずか1ドル でメンションを表示します。

4)2025/07/05

あなたは環境科学の論文で引用された「伏見浩之」ですか?

Mentioned by Takehiko Fukushima

You

Academia.edu

親愛なるヒロジ、

H. Fushimi」という名前は、アカデミアにアップロードされたEnvironmental Scienceの論文で引用されました。

5) 2025/07/08

あなたは地理学の論文で引用された「伏見浩之」ですか?

Mentioned by Kimberly Casey

You

Academia.edu

親愛なるヒロジ、

H. Fushimi」という名前は、AcademiaにアップロードされたGeographyの論文で引用されました。

6) 2025/07/12

あなたは環境科学の論文で引用された「伏見浩之」ですか?

Mentioned by Masahiro Maruo

You

Academia.edu

親愛なるヒロジ、

H. Fushimi」という名前は、アカデミアにアップロードされたEnvironmental Scienceの論文で引用されました。

7) 2025/07/16

あなたは地質学の論文で引用されている「伏見弘之」ですか?

Mentioned by Jonathan Carrivick

You

Academia.edu

親愛なるヒロジ、

H. Fushimi」という名前は、アカデミアにアップロードされた地質学の論文で引用されました。

8) 2025/07/18

「角田欽一」が言及した「伏見浩之」

Mentioned by Kin-Ichi Tsunoda

You

Academia.edu

親愛なるヒロジ、

H. 伏見」は「角田欽一」によって言及されました。

9) 2025/07/21

「西村浩一」が語る「伏見英」

Mentioned by Kouichi Nishimura

You

Academia.edu

親愛なるヒロジ、

「伏見博」は「西村浩一」によって言及されました。

Show original message

H. Fushimi mentioned by Kouichi Nishimura

Mentioned by Kouichi Nishimura

You

Academia.edu

Dear Hiroji,

H. Fushimi was mentioned by Kouichi Nishimura.

10) 2025/07/23

Translated from English

誰かがアカデミア検索で「Chの山の降雪...」を見つけました

Academia.edu

伏見博司さんへ

最近、誰かがアカデミアの検索で「Chの山の降雪...」を見つけました。

11) 2025/07/27

「伏見博司」という名前は、環境科学に関心のある方がアカデミアにアップロードしたPDFで言及されています

Academia.edu

You

Academia.edu

親愛なるヒロジ、

環境科学に興味のある方が、アカデミアにアップロードされたPDFで「伏見博司」という名前を挙げました。

Show original message

interested in Environmental Science

Academia.edu

You

Academia.edu

Dear Hiroji,

Someone interested in Environmental Science mentioned the name "Hiroji Fushimi" in a PDF uploaded to Academia.

12) 2025/07/29

Claim "A New Snow Sampler for Stratigraphic Observation" for your profile

A New Snow Sampler for Stratigraphic Observation

You

Academia.edu

ヒロジ、この出版物はあなたのものですか?プロフィールを最新の状態に保つのにご協力ください。

層序観測のための新しい雪のサンプラー

伏見 浩司

1977年、日本雪氷学会誌

プロフィールに追加

これは私ではありません

この論文を追加すると、Academia.edu にアップロードされます。