Deep Research 初挑戦:人間が働く意味ってなんだろう

📢 この記事は gemini-2.5-flash によって翻訳されました

最近さ、GLM-5とかOpenAI GPT-5.3が発表されて、急に話題になった『妹居物語』を体験したりAutoGPTについて調べたりしたんだよね。一部はもう発表済みの技術だけど、僕にとっては初めての体験だったから、かなり衝撃を受けたよ。2日間、最先端AI技術を探索しまくって、また失業不安に襲われちゃった。

生成AIの進化

ChatGPTのディープサーチみたいな機能は以前も使ったことあったんだけど、初めてGemini Deep Researchを使った時、もしこれ、本当に文献から情報引っ張ってきてるんだとしたら、実質的にそのまま発表できるレベルの総説論文じゃん!って気づいたんだ。なんかボーゼンとしちゃってさ、大学の卒論でやった学術トレーニングって、AIの前ではもう意味ないのかなって思っちゃったよ。

しかもこれ、まだDeep Researchの話でしょ? Gemini Deep Thinkモードがどれだけヤバいのか想像もつかないし、そこから生成される文章って、もう本当に研究に使えるレベルなのかも、って思ってる。

自律エージェントへの変貌

同時にAutoGPTの構想を知って、AIって会話だけじゃないんだって気づかされた。AIが自己改善を繰り返しながら目標を達成する、ってのが最終的な進化の道筋なのかもしれない。

前、OpenClawが話題になった時、あれが描いてるものを実現するにはどんなプロンプトが必要なんだろうって考えてたんだけど、今思えば僕の考え方、保守的すぎたわ。AI自身にプロンプト生成させればいいじゃんって。モデルの学習と同じで、loss functionをAI自身が判断して最適化するってことだよね。

それから、『妹居物語』をプレイしてみてさらに衝撃だったのは、カスタマイズされたプロンプトを使えば、リアルタイムで記憶を持ったキャラクターとのインタラクションを完全に作り出せるってこと。これってOpenClawが個人アシスタントとして技術的に実現可能ってことを裏付けてるんだよね。同時に、かつての「フル生成型ビジュアルノベル」っていうのが、今は本当に計算コストだけの問題になってきてるのかもしれない。

SOTA(現状最高性能)の現状

でもさ、そうは言っても、今AIって一体どこまで進化してるんだろうね。Geminiで調べてみた記事によると、今のAIは汎用的な方向性だけじゃなくて、専門分野に特化して発展してるみたい。以下が現在の主要な発展方向だよ。

  • Claude:コード生成能力
  • ChatGPT:深い推論と自己検証
  • Gemini:マルチモーダル認識と超長記憶
  • Copilot:ブラックボックス統合が売り

まとめると、大げさじゃなく、今のAIはもはや単なる生成ツールじゃないってこと。どうもデジタル従業員っていうか、そういう傾向がある気がするんだ。タスクを受け取って、自分で分析して、プロンプトを生成して、完了条件を設定して、成果物を出すまで繰り返し改善していく。この一連のプロセスってさ、完全に上司(人間)が部下(AI)に仕事を振って、最終成果をチェックするって構図そのものじゃん?

人間の存在意義

でも、AIが出始めた頃に産業革命を例に出す人がいたように、機械が肉体労働者を置き換えて一部の人が失業しても、同時にたくさんの雇用を生み出して、労働環境も改善されたじゃん? AIの発展も、最終的には新しい仕事を生み出すはず、って言われてるよね。

それに、AIは想像を絶する力を持ってるけど、やっぱり「起動する人」と「最終的にOK出す人」が必要なんだ。AIの動作って、人間が設定する「目標」とか「意図」に左右されるわけだし。人間の創造力って、今のAIのアーキテクチャでは勾配降下法じゃ学習できないものみたいだしね。

だけど、実際に体験してみて、僕はやっぱり悲観的だよ。もし人間の唯一の役割がアイデアを出すことだけだとしたら、この世界に「創造性が必要な」仕事って、一体どれくらい必要なんだろう? 実行コストが大幅に下がった時、ほとんどの「実行者」としての人間の従業員って、彼らの価値ってどこにあるんだろうね?

This post is licensed under CC BY-NC-SA 4.0 by the author.

Visits Since 2025-02-28

Hugo で構築されています。 | テーマ StackJimmy によって設計されています。