ディープラーニング関連の記事一覧
ディープラーニング一般
ディープラーニング関連の記事が増えてきたので一覧を作成しました。このリンクページは、定期更新する予定ですので、ブログ記事の検索に役立つと思います。
一般
TTA(Test Time Augmentation)
TTA(Test Time Augmentation)とは?PyTorchでの実装方法
活性化関数
活性化関数(Activation Function)って何?代表的な関数を紹介【初級 深層学習講座】
Adaptive Pooling
Adaptive Pooling層の動きをわかりやすく解説【初級 深層学習講座】
ドロップアウト
Dropoutの仕組みと学習・推論時の動作の違いを解説【初級 深層学習講座】
バッチ正規化(Batch Normalization)
Batch Normalizationの仕組みと学習・推論時の動作の違いを理解する 【初級 深層学習講座】
Conv1D
畳み込み層(CNN, Conv1D)の動きをわかりやすく解説 【初級 深層学習講座】
エポック数、ステップ数、バッチサイズ
エポック数(epoch)とステップ数(step)の違い、バッチサイズとは【初級 深層学習講座】
ノイズ画像の検出(Cleanlab)
Cleanlabでノイズラベルを検出し、画像データセットのクオリティ向上させる方法
Gradioを使ったGUI
Google ColabでGUI|gradioを利用したウェブアプリの作り方を解説
顔認証、深層距離学習など
顔認証
1対1の顔認証をFaceNetを使って簡単に実装する方法|PyTorch
1対Nの高速な顔認証をFaceNetとFaissを使って実装する方法|PyTorch
深層距離学習(Metric Learning)
深層距離学習と近似最近傍探索による特徴量マッチング|Pytorch Metric Learning+Faiss
物体検出・セグメンテーションなど
セグメンテーション
ultralytics版のSAMでゼロショットセグメンテーションに挑戦
FastSAMによるゼロショットセグメンテーション|使い方を解説
Segmentation Anything(SAM)によるゼロショットセグメンテーション|使い方
SegFormerによる学習と推論:Transformerモデルでセグメンテーション
YOLO関連
YOLOv8(YOLOv9)で独自データを使った学習と推論を実践(物体検出)
M1とM2 Mac(GPU)のディープラーニング性能をチェック|YOLOv8(学習)でベンチマーク
YOLOv8の物体追跡(MOT):BoT-SORTとByteTrackのパラメータを調査
YOLOv8で物体追跡を実践|YOLOv8は追跡もできるらしい
物体検出のアノテーションで楽する方法(YOLOv8+labelImg)
YOLOの検出枠・セグメンテーション結果を「supervision」で可視化
YOLOv8によるセグメンテーション:カスタムデータの学習から推論まで
ゼロショットで物体検出可能なYOLOv8-Worldモデルを試す
YOLOv5を使った独自データの学習と推論|ultralytics YOLOリポジトリ
YOLO-NASでカスタム(独自)データの学習と推論を実践|物体検出
自然言語処理、LLMなど
Tokenizer
Hugging FaceのTokenizerを理解する|動作まとめ
Bert
Hugging FaceのBERTモデルで回帰分析(Regression)を実践する
Hugging FaceのBERTモデルでクラス分類(classification)を実践する
LLM
HuggingFace(Llama2, Gemma, Calm2)の使い方|大規模言語モデル実践
擬似会話でLLMの回答をコントロールする方法|Few-shot Promptingの応用テクニック
HuggingFaceの大規模言語モデル(LLM)のチャットテンプレートの使い方
RakutenAI-7BとGradioでチャットボットをサクッと作成|新しい大規模言語モデル(LLM)を試してみる
Sentence Transformersで文章をベクトル化し、類似度を調べる方法
大規模言語モデル(LLM)をMacbook Airで動かしてみた|Google Gemma
LangChain
LangChainのFaissを活用した近似最近傍探索の手順を解説
LangChainで実装するRAG|CALM2 + FAISS + RetrievalQAを使った具体例
その他
HuggingFace Transformerの精度向上テクニック | 出力のPooling手法
textstat文章の読みやすさを数値化し、機械学習の特徴量として活用する方法
音声処理
認識・翻訳・識別
OpenAIのWhisper v3による音声認識・翻訳・識別を試す【Python】
Text2SpeechとSpeech2Textを繰り返すとどうなる実験結果を公開
ESPnet2を使った日本語音声認識(Speech To Text)の手順解説
ESPnet2を使った日本語音声合成(Text-To-Speech)の手順解説
音声データ処理
Mel Spectrogram|音声データを画像(二次元データ)として深層学習する方法
スペクトログラムを用いた音声データの学習|音声データを画像化してCNNで学習する手法を紹介
データ拡張
データ拡張(Data Augmentation)とは?手法と実装例【初級 深層学習講座】
Audiomentations|音声データ向けデータ拡張ライブラリを解説
データ拡張(data augmentation)手法のmixupを解説|Pytorchでの実装方法【初級 深層学習講座】
timmを使ってMixup/CutMixを手軽に実装する方法
Pythonでカラーノイズ(ピンクノイズ、ホワイトノイズ)を生成する
Albumentations:物体検出(枠)にも対応したデータ拡張ライブラリを解説
PyTorch
PyTorch
データ拡張(data augmentation)手法のmixupを解説|Pytorch 【初級 深層学習講座】
音/音声データを画像用DNN(CNN)で学習・推論する方法を解説
GradCamをPyTorchのforward/backward hookで実装し、判断根拠を可視化する【初級 深層学習講座】
テンソル演算の可読性を向上させる、Einopsの使い方【Pytorch】
検出枠に対応!torchvisionのデータ拡張(v2)の使い方を解説
PyTorchの可視化機能を紹介|物体検出枠とセグメンテーション結果を可視化
Pythonで乱数を発生させる方法【random, numpy, pytorchの差異に注意】
PyTroch基礎
PyTorchテンソル操作・演算の逆引きチートシート 【初級 深層学習講座】
Pandas, Numpy, PyTorch, PIL, OpenCV相互変換チートシート
PyTorchの逆伝播を関数を自作して理解する【初級 深層学習講座】
PyTorch-独自データセット(custom dataset)の作り方【初級 深層学習講座】
MNIST
PyTorchで手書き文字(MNIST)の認識の実装に挑戦【初級 深層学習講座】
手書き文字(MNIST)認識をオリジナルのCNNでやってみる【初級 深層学習講座】
チューニング
PyTorchで部分的にレイヤーをフリーズする方法|Kaggleで使えるファインチューニング手法
ラベル加工関連(Label Smoothing、Psudo Labeling)
ラベル平滑化(Label Smoothing)とは?アルゴリズムとPytorchでの実装方法【初級 深層学習講座】
擬似ラベリング(Pseudo Labeling)でラベリング対象を選ぶ方法|エントロピーを活用したアプローチを解説
Pytorch Lightning
PyTorch Lightningを使ったクラス分類(犬猫分類)を実践
timm
PyTorch TIMMでモデル生成・一覧取得の方法(create_modelチートシート)
timmを使ってMixup/CutMixを手軽に実装する方法
PyTorch+TIMMでクラス分類(犬猫分類)にチャレンジ
様々な手法の実装
重みの平均化で精度向上させるModel SoupsをPyTorchで実装する
アンサンブルと違って処理時間が増えない精度改善手法:Model Soups
Model Soupsについて二回書いていることに気づきました・・・
PyTorch以外
Keras
PyTorchユーザーがKerasを使ってみた(メリット・デメリットと感想)
アノテーションツール
Label Studioの自動アノテーション(AI支援)にYOLOv8を使う方法
【超多機能!】LabelStudioを使った物体検知のアノテーション手順
物体検出用アノテーションツール「labelImg」の使い方(YOLO対応)
Kaggle
TIPSなど
Kaggleの公開ノートブックを日本語に翻訳するChrome拡張機能を紹介
HuggingFace Transformerの精度向上テクニック | 出力のPooling手法
ファインチューニングで一部のレイヤー(層)をフリーズする方法 | Kaggle TIPS
Google Colabの活用ガイド|KaggleとColabでコードを共有する方法
Google Colab Proの解約手続きと残り日数の扱いについて解説
Kaggleチャレンジ記録
CommonLit(2023)に挑戦| Kaggleチャレンジ記録
惨敗したICRコンペの取り組み内容まとめ|kaggleチャレンジ記録
Santa 2023 : The Polytope Permutation Puzzleに挑戦| Kaggleチャレンジ記録
LLM Prompt Recoveryに挑戦| Kaggleチャレンジ記録
BirdCLEF 2024に挑戦| Kaggleチャレンジ記録
その他
Google Colab
Colab Proを最大限に活用する|機械学習にはハイメモリが良い理由
Google Colabのランタイムをコードで終了させる方法
Google Colab Proの解約手続きと残り日数の扱いについて解説
iCrawlerで画像収集を自動化する|Pythonでクローリングする方法