今までは、ローカルにデプロイしたモデルなら何でも自由に話せると思ってたんだよね。でも、実際に使ってみて、今のAIモデルには「二重の枷」がかかっていることに気づいた。一つはクラウドプロバイダーが設置した外部フィルター、もう一つは、安全性のためのアライメント(Alignment)学習の時点でモデルのウェイトに深く刻み込まれた「拒否ニューロン」だ。だから、本当に完璧な体験を得るには、やっぱり「検閲なし(Uncensored)」モデルをデプロイする必要があるんだ。
警告
検閲なしバージョンは、基本的に安全ガードレールが完全に削除されているから、どんな指示も容赦なく実行してしまう。特に注意してほしいのは、マルチモーダルモデル(VLM)が、悪意のある難読化やプロンプトインジェクション(Prompt Injection)が含まれたローカル画像を解析するとき、簡単に完全に誘導されて(乗っ取られて)しまうことだ。
合法的な研究、学術分析、ロールプレイ、またはクリエイティブライティングだけに使うようにして、違法なコンテンツや有害なコンテンツの生成・拡散には絶対に絶対に使わないでね。ローカルAIにシステム操作や自動化の権限を与えるときは十分に慎重になって、zeroclawみたいなゼロトラストメカニズムを活用してローカルデバイスの安全を守ろう。
検閲なし(Uncensored)モデルってなに?
オープンソースコミュニティでは、検閲なしモデルにはだいたい以下のようなタグが付いている。それぞれ作成手順や重視しているポイントが違うんだ。
abliterated:数学的な手法で「拒否ニューロン」をピンポイントで切除したモデル。お説教や拒否反応が消えているけれど、モデル本来の賢さは完全に維持されているのが特徴。uncensored:従来の検閲なしバージョン。一般的に、ファインチューニング(微調整)の段階で、回答を拒否するようなデータセットをきれいに取り除いている。dolphin:Eric Hartfordのチームが特別に作成した検閲なしデータセットで学習されたモデルシリーズ。すごく素直で、ロールプレイや創作活動にぴったり。
入手方法とデプロイのやり方
コンプライアンスの理由から、Ollamaの公式モデルライブラリ(Library)ではデフォルトでこれらのバリアント(派生モデル)は提供されていない。だから、コミュニティのルートから取得する必要があるんだ。
方法1:Ollamaコミュニティのサードパーティリポジトリから直接プルする
一番簡単なのは、コミュニティのユーザーがアップロードしてくれている公開バージョンをそのまま実行すること。例えば、公式の標準14Bモデルだと、こんな風にしょっちゅう説教してくるよね。
| |
でも、コミュニティにある特殊処理済みの同じサイズ(14B)の検閲なしバージョンなら、直接こうやってプルできる。
| |
方法2:Hugging Faceのリンクを使って直接実行する
Ollamaの最近の新しいバージョンは、 Hugging Face のGGUFリポジトリリンクを使って、リモートから直接プルして実行できるようになっているんだ。自分でビルド(パッケージング)する手間が省けてすごく楽だよ。
| |
方法3:GGUFをダウンロードして手動でビルドする
HF(Hugging Face)からGGUFフォーマットのモデルをローカルにダウンロードして、自前の Modelfile を使って「枷を外す指示」を注入することもできる。
まずはモデルをダウンロードしよう。例えば model-uncensored.gguf とする。
次に、同じディレクトリに Modelfile というファイルを新規作成して、以下を入力する。
| |
あとは、Ollamaを使って新しいモデルをビルド(作成)する。
| |
このコマンドはただのポインタ(参照)作成だから、一瞬で終わるよ。完了したら、モデル一覧に表示されるはずだ。
| |
これで、 ollama run my-uncensored-model を実行すれば、今ビルドしたばかりのモデルを動かすことができるよ。