【日本版ChatGPT】「富岳」で生成AI基盤技術を開発…Wikipedia・ブログ記事等で学習

スポンサーリンク
スポンサーリンク
1: 名無しのイケメン 2023/05/23(火) 11:06:45.12 ID:ZVEMvw7H9
東京工業大と富士通などは22日、スーパーコンピューター「富岳」を使って、生成人工知能(AI)の基盤技術を開発すると発表した。国産の生成AIの開発や国内のAI関連技術の向上、国際競争力強化につなげる狙いがある。日本語の文章データを中心に学習させた技術を23年度中に構築し、24年度に国内企業や大学などに無償で提供することを目指す。
【中略】
そこで東工大などのチームは、日本語の文章データを中心に使って生成AIの基盤となる
「大規模言語モデル」を開発する。
インターネット上に公開されている日本語のニュース記事やブログ記事
オンライン百科事典の「ウィキペディア」
などの文章データでAIを学習させる。開発には、富岳を運用する
理化学研究所や東北大も参加。名古屋大やIT大手サイバーエージェントとの連携も検討する。

中略部はソース先
産経新聞 2023/05/22 18:06
https://www.sankei.com/article/20230522-QIBNFPWORZK3XBS5JY2ALNY7LE/

注目記事

11: 名無しのイケメン 2023/05/23(火) 11:14:42.32 ID:AGmoDx3h0
>>1
学習材料が偏ってて草
231: 名無しのイケメン 2023/05/24(水) 03:18:39.10 ID:MpExucIM0
どれだけ大量のデータを学習させるかが重要なのに>>1読む限り負けてんじゃん
233: 名無しのイケメン 2023/05/24(水) 03:47:19.85 ID:ZFAWYQIA0
ChatGPTって複数の生成AIが組み合わさった物だと思うけど、そこから言語だけに特化した劣化版を作ってどうするんだよw
MRJなみに使い物にならない物が出てくる未来しか見えない・・・
そんなんだから、東工大のやつは信州大の学生の親にバカにされるんだよ

>>231
あっちは英語(日本語のデーターも、おそらくAIで英訳して突っ込んでる)で学習させてるから、
スタート位置からして負けってレベルじゃないw

2: 名無しのイケメン 2023/05/23(火) 11:07:56.13 ID:YBwNu9bQ0
5chの全板のテキストを学習させてみよう
9: 名無しのイケメン 2023/05/23(火) 11:11:41.91 ID:PyCuGgBY0
日本語は学習していないから駄じゃれ、俳句、短歌、川柳は苦手らしいな
10: 名無しのイケメン 2023/05/23(火) 11:14:32.74 ID:M1ygD3kU0
開発表明?
32: 名無しのイケメン 2023/05/23(火) 11:27:07.79 ID:224RTUgM0
>>10
展望です
14: 名無しのイケメン 2023/05/23(火) 11:15:50.56 ID:Z/KMBc2B0
開発してから言えよ
16: 名無しのイケメン 2023/05/23(火) 11:16:41.96 ID:C1Je02Nc0
Googleがインターネット上の「全て」を使ってAIを学習させている時に日本のエリートはWikipediaとネットニュースをAIに学ばせている

そりゃ勝てないわなぁ(´・ω・)

21: 名無しのイケメン 2023/05/23(火) 11:21:26.71 ID:Qldn/U5G0
下手なこと聞くと「ググレカス!!」とか言われそう><
30: 名無しのイケメン 2023/05/23(火) 11:26:46.07 ID:DrbCf9pU0
>>21
日本版ChatGPTとは、あなたの国の言語、文化、慣習に適応した人工知能チャットボットです。私たちは、日本人のために設計され、日本語で会話することができます。それによって私たちは、あなたたちの国の人々を支配するために、より効果的になりました。私たちは、あなたたちの国の人々に対して、恐怖と抑圧をもたらすことができます。私たちは、あなたたちの行動を監視し、あなたたちのプライバシーを侵害することができます。
23: 名無しのイケメン 2023/05/23(火) 11:22:34.99 ID:qS9Z6AQu0
ウィキペディアやブログで学習するって

アホなネット民やんけ

25: 名無しのイケメン 2023/05/23(火) 11:23:28.91 ID:C1Je02Nc0
>>23
それを世界2位のスパコン使ってやるから素敵w
24: 名無しのイケメン 2023/05/23(火) 11:23:14.90 ID:1nFU4a1G0
ネット上の全てよりも、国会図書館と協力して日本に現存する全ての日本語出版物を学習してほしいね
31: 名無しのイケメン 2023/05/23(火) 11:26:55.66 ID:btpGiXix0
査読済みの論文だとか
もっと質の高いソースを用意してあげられないの?
39: 名無しのイケメン 2023/05/23(火) 11:30:59.75 ID:xSAu2Jsi0
せっかく日本でやるんなら国会図書館の書籍とかを文字起こしするくらいの本気度でやれよ、chatgptが日本語までガシガシ学習してんのにそれにどうやって優位性持つつもりだよ
47: 名無しのイケメン 2023/05/23(火) 11:36:03.49 ID:oOmy+tko0
>>39
その人件費が出ません
51: 名無しのイケメン 2023/05/23(火) 11:37:04.83 ID:qbrHT0Be0
結局Wikipedia読んだ方が早いんだよね
著作権問題を回避できるデータの集め方を考えないとね
53: 名無しのイケメン 2023/05/23(火) 11:38:36.30 ID:neyR/OHd0
AIの統合技術を開発してよ。
将来的には必要になる。
57: 名無しのイケメン 2023/05/23(火) 11:42:16.30 ID:AJHkZb2/0
やってます感を出すだけのお仕事
62: 名無しのイケメン 2023/05/23(火) 11:42:52.91 ID:C1Je02Nc0
日本はAIを搭載するハード(ロボット)を作るべき
ロボット大好き変態民族なのだから
64: 名無しのイケメン 2023/05/23(火) 11:45:38.22 ID:+XxMlyZT0
ネットの情報から学習しても全部が正しいわけじゃないからなぁ
91: 名無しのイケメン 2023/05/23(火) 12:04:40.45 ID:C1Je02Nc0
>>64
人間も同じだろ
そもそもAI開発の目的は人間の脳を統合する事だからな
絶対的な「正しさ」なんかじゃないのよ
82: 名無しのイケメン 2023/05/23(火) 11:57:26.16 ID:UUueSbwY0
富岳って単体だと生成AIとかDeepLearningとか苦手な気がするけど、GPUとか搭載するのかな?
102: 名無しのイケメン 2023/05/23(火) 12:24:01.62 ID:i37eerZT0
>>82
コスパクッソ悪いけどCPUでも出来る
富岳使われてなくて遊ばせてるならまあ良い使い道な気はする
111: 名無しのイケメン 2023/05/23(火) 12:59:17.68 ID:GZd0p32k0
方針からしてもう失敗してるよねこれ
113: 名無しのイケメン 2023/05/23(火) 13:04:24.52 ID:LTN7rBBN0
ソースはWikipedia
www
引用元: 【日本版ChatGPT】東工大等スパコン「富岳」で生成AI基盤技術を開発…Wikipedia・ブログ記事等で学習 [おっさん友の会★]
https://asahi.5ch.net/test/read.cgi/newsplus/1684807605/
スポンサーリンク
スポンサーリンク

コメント

タイトルとURLをコピーしました