📢 この記事は gemini-3-flash-preview によって翻訳されました
インストールと環境構築
公式のインストール参考: Installing conda - conda documentation
ダウンロードリンク: Download anaconda
Miniconda をダウンロードして、必要に応じて自分で環境を作るのもいいと思う。
実行環境を作成する:
| |
環境をアクティベートする:
| |
PyTorch のインストール
CPU 版を使うなら、このコマンドをそのまま実行すればOK。
| |
GPU 版が必要な場合は公式サイトからダウンロードしてね。 https://pytorch.org/get-started/locally/ でインストールコマンドが確認できるよ。
CUDA のバージョンは、このコマンドで確認できる。
| |
インストールが終わったら、ちゃんと使えるかチェックしてみよう。
| |
画像のアノテーション
ローカルでちょっとしたアノテーションをやるなら labelImg が手軽。pip でインストールできるよ。
| |
そんで、このコマンドで GUI ウィンドウを開いて使う。
| |
画像のパスとアノテーションの保存先を選ぶのを忘れないで。あと、データ形式を YOLO に切り替えるのも大事。
W キー(大文字の W)を押すと、新しいアノテーションを作成できるよ。
モデルの学習
YOLO26 公式ドキュメント: Ultralytics YOLO26
YOLO をインストール:
| |
モデル学習用のコード:
| |
データの定義ファイル data.yaml:
| |
学習結果(成果物)
学習が終わると、runs/detect の中にいろいろファイルが出来上がるよ。
weights/ フォルダの中にあるのがモデルファイル。
best.pt:精度が一番良かった重みlast.pt:最後の学習ステップの重み
グラフ類:
results.png:学習の損失 (Loss) と精度指標 (mAP) をまとめたもの- 曲線が右肩上がりならまだ学習中、平らになってきたら学習が十分に行き届いた(収束した)ってこと。
confusion_matrix.png:混同行列。モデルが物体を背景と間違えたり、別のものと誤認したりした確率がわかるよ。- 対角線が明るいほど、正しく識別できている証拠。
Box*_curve.png:それぞれ適合率 (Precision)、再現率 (Recall)、そしてそのバランス曲線。labels.jpg:全アノテーションの統計グラフ。ボックスのサイズの分布やクラスの比率が見れる。
画像アノテーションの結果:
train_batch*.jpg:学習時に実際に使われた画像。val_batch*_labels.jpg:検証用のアノテーション画像。val_batch*_pred.jpg:モデルによる予測結果。
その他のファイル:
args.yaml:今回の学習で使った全パラメータ設定。次回の再現に便利。results.csv:results.pngの元データ。
モデルを使ってみる
| |