大規模言語モデルテクニック - PCテクニック - テクニック - オンラインPC館

大規模言語モデル

大規模言語モデル

大規模言語モデルの情報です。
大規模言語モデル（LLM：Large Language Model）とは？
AIが瞬時に「自然で適切な言い回し」の文章を提案　CEOが語る、新登場「DeepL Write Pro」の実力
 Apple、iPhoneでも稼働するオープンな言語モデル「OpenELM」を公開
 世界最強のオープンソース型AIモデル誕生の内側
 Meta、無料で商用可の新LLM「Llama 3」、ほぼすべてのクラウドでアクセス可能に
 無料で商用利用可能なオープンモデル「Mixtral 8x22B」が登場、高いコーディングと数学の能力を持つ
 PyTorchやPythonなしの純粋なC言語を使用した大規模言語モデルトレーニングツール「llm.c」がリリースされる
 Mistral AIが突如として新しい大規模言語モデル「8x22B MOE」を発表、コンテキスト長65kでパラメーターサイズは最大1760億か
 Appleがスマホの画面を認識できるマルチモーダルLLM「Ferret-UI」を発表、SiriがiPhoneアプリのUIを理解できるようになる可能性も
 日本語対応でGPT-4よりも高性能な大規模言語モデル「Command R＋」が登場したので使ってみた、無料でダウンロードしてローカル動作も可能
 「Llama 2-7B」の1万分の1以下の学習コストなのにLlama 2-7Bを上回る大規模言語モデル「JetMoE-8B」が登場
 大規模言語モデルを単一ファイルで配布・実行する「llamafile」のバージョン0.7で処理能力が最大10倍高速化
 SSM-Transformerアーキテクチャ採用で従来の約3倍のスループットを実現した大規模言語モデル「Jamba」をAI21 Labsが発表
 「Transformer」後継と期待される「RetNet」活用　PKSHAが日英対応の独自LLMを開発　日本MSも協力
 Databricksがオープンな大規模言語モデル「DBRX」をリリース、GPT-3.5やCodeLLaMA-70Bを上回る性能
 大規模言語モデルの計算能力を桁違いに増強するカスタマイズハードウェアを作るスタートアップ「MatX」
NTT、大規模言語モデル「tsuzumi」を提供開始　“鼓”奏者も演奏で祝福　LLM開発競争をどう戦う？
OpenAIの次世代大規模言語モデル「GPT-5」が2024年夏に公開されるとの報道
 国産LLMが抱える“開発コスト”の課題　海外勢に安さで勝てるか、ELYZA代表の危機感
 ELYZAが新たな日本語LLMを開発　「GPT-3.5 Turboにも匹敵」　チャット形式のデモサイトも公開
 GPT-4の半分以下の計算でほぼ同等なIQを持つパーソナルAI「Pi」と基盤モデル「Inflection-2.5」が登場
 GPT-4超えをアピールするClaude-3がAIで初めてIQ100超えを達成したという報告
 大規模言語モデルの動作をExcelで完全に再現することでプログラミングをせずにAIの構造を学習できるシートが登場
 Microsoftが1.58ビットの大規模言語モデルをリリース、行列計算を足し算にできて計算コスト激減へ
 音声・テキスト・画像・音楽の入出力に対応したマルチモーダル大規模言語モデル(LLM)「AnyGPT」が登場
 大規模言語モデル(LLM)を爆速で動作させる「言語処理ユニット(LPU)」を開発する「Groq」が爆速アルファデモを公開
 101言語に対応したオープンソースの大規模言語モデル「Aya」をCohere for AIがリリース
 大規模言語モデルへの入力プロンプトを意味を保ったまま高度に圧縮する技術「LLMLingua」をMicrosoftが開発
 日本語に強い大規模言語モデル「Swallow」　産総研と東工大が公開　事前学習用の日本語データに工夫
 大規模言語モデル(LLM)をLoRAで強化する際に役立つ情報を研究者が公開
 Anthropicが大規模言語モデル「Claude 2.1」をリリース、最大20万トークン・15万ワードを読込可能で幻覚が半減し新しいAPI統合などを提供
 大規模言語モデルを選択→数秒後にAzure上で試せる「Models as a Service」登場　従量課金制の推論API、ファインチューニングも可能。
大規模言語モデルをLoRAで低コストかつ効率的に微調整できる「Punica」が登場
 Yahoo!知恵袋に「AI回答機能」　GPT-4活用で実装へ　AIによる「良質な質問」も

GPT-4情報

GPT-4はOpenAIによって開発された大規模言語モデルです。
GPT-4とは
 GPT-4
GPT-4が眼科の医療試験で人間の専門医に匹敵するスコアをたたき出したとの研究結果
 大学入試共通テスト、3つのチャットAIに解かせてみたら？　GPT-4はバケモノだった
 GPT-4VでiPhoneの画面を操作するシステム　米Microsoftなどの研究者らが開発
 OpenAIが次世代の「GPT-4 Turbo」やカスタムできる「GPTs」を発表／イーロン・マスクが対話型AI「Grok」
マイクロソフト提供の“社内GPT基盤”もGPT-4 Turboなどに対応
 OpenAI、改良版生成AIモデル「GPT-4 Turbo」を「GPT-4」より安価に提供へ

Googleの大規模言語モデル情報

Googleの作った大規模言語モデルに関する情報です。
GoogleがAIに無限の長さのテキストを処理できる能力を与える技術を発表
 Googleがオープンかつ商用利用可能な大規模言語モデル「Gemma」ファミリーにコード補完・生成・命令フォローを強化した「CodeGemma」と効率を最適化した「RecurrentGemma」を追加すると発表
 Googleがオープンかつ商用利用可能で軽量な大規模言語モデル「Gemma」を公開

トップページ → テクニック → PCテクニック → 大規模言語モデルテクニック