生成AIの界隈で話題となっている「Deep Seek R1」について、速報的にまとめました。
要約すると、以下のような内容です。
ChatGPT o1に匹敵するレベルの性能を達成
フルオープンソース
MITライセンスで商用利用可能
既にAPIが公開されている
APIコストはo1に比べておよそ1/20以下
といいます。
以下の図は、Deep Seek R1やo1、o1-mini、Deep Seekの従来の最新モデルV3を比較した図です。
これを見ると、R1はo1と同等レベルの性能を示していることがわかります。
ホワイトペーパー:https://github.com/deepseek-ai/DeepSeek-R1/blob/main/DeepSeek_R1.pdf
実際にチャットを利用するには以下のリンクから。「DeepThink」をオンにして利用してみてください。
Butterfly 🦋📩 未読メールのストレス、ニュースレターの消化不良から読者を解放するマイクロSaaS
新しくプロダクト(マイクロSaaS)を開発するために、ChatGPTなどを使って、仕事の合間にコツコツと開発を進めています。
やすい、早い、高性能の秘訣とは
中国のAI開発企業のDeepSeekは21日、新たな大規模言語モデル「DeepSeek-R1」シリーズを公開しました。
このモデルは、教師データ依存からの脱却を実現した自律学習型AIで、OpenAIのo1シリーズと同等の推論性能を1/20のコストで実現することができると説明されています。
学オリンピック級問題解決や医療診断支援などでの実績を背景に、オープンソース市場に大きな話題を起こしました。
Deep Seek R1の最大の特徴は、人間の学習プロセスを模した「強化学習(Reinforcement Learning, RL)」にあるといわれています。RLとは、学習主体が環境との相互作用を通じて、目的を達成するための最適な行動を学ぶ機械学習の一分野です。
具体的には、以下のようなプロセスを経て、数学オリンピックの問題も解決するほどの性能を示したそうです。
数学問題解決プロセス
初期:確率計算で10回連続失敗
500試行後:独自の近似計算法を開発
1000試行後:国際数学オリンピック問題を解決
数学専門書レベルの問題10万問を厳選してあたえ、意図的な誤答混入により、誤り検出能力を強化していったそうです。問題解決の型よりも、学び方そのものを習得させるような設計を行ったとのこと。
AIがアハ体験を報告した
大変興味深いのは、この教科学習の過程で、Deep Seek R1は数学問題で行き詰まった後、
「Wait, wait, Wait. That’s an aha moment I can flag here」
と発言し、新しい問題の解法アプローチを試し始め、独自の解法を編み出す様子が観測れたといいます。
DeepSeekのチーフサイエンティストは「報酬設計が内省を促した」と分析しているそうです。
性能・コスト比較
主要な高性能モデルとトークンあたりの価格から、コスト比を算出しました。
なお、R1は小型モデル含め複数のモデルが公開されています。
参考として、
DeepSeek-R1-Zero:強化学習(RL)のみ
DeepSeek-R1:RLの前に教師あり微調整(cold-start)しOpenAI 4oと同レベル
DeepSeek-R1-Distill-Qwen-32B:DeepSeek-R1から抽出されたQwenに基づくモデルでo1に匹敵
とのことです。
注意点
Deep Seek は中国のAI企業が開発していることもあり、利用規約の準拠法は中華人民共和国に則るとされています。
DeepSeek利用規約には、以下のようなリスクが明確または推測される形で含まれています。
入力・出力データがサービス改善のために使用される可能性。
データが中国の法律に従い管理される可能性。
必要に応じて、中国の法執行機関に情報が提供されるリスク。
アカウントの漏洩や不正使用に対する責任がすべてユーザーにある。
これらを踏まえ、利用を検討する際は慎重に扱うのが望ましいです。
利用規約:https://chat.deepseek.com/downloads/DeepSeek Terms of Use.html
個人的な感想
チャットを利用してみると出力が爆速でo1のように推論を経てから回答してくることを実感できた
文章生成のクオリティは、ChatGPT o1の方が優秀
ただ、推論プロセスがすべて公開されており、「まず最初に〜」「いや、やっぱちがうな」「ユーザーのニーズはこうだ」みたいな独り言のような思考プロセスが見られるのが興味深いと思った
APIでデータをトレーニングされることを前提にした開発には使えそう
今回は速報的にまとめました。
こういった、テーマや速報的な記事が役に立ったという方はいいねやコメントいただけたらできる限り継続させてもらいます。