ディープラーニング関連の記事一覧
ディープラーニング一般
ディープラーニング関連の記事が増えてきたので一覧を作成しました。このリンクページは、定期更新する予定ですので、ブログ記事の検索に役立つと思います。
一般
TTA(Test Time Augmentation)って何?とりあえず実装してみる
活性化関数(Activation Function)の動きを理解する【初級 深層学習講座】
Adaptive Pooling層の動きをわかりやすく解説【初級 深層学習講座】
Dropoutの学習時と推論時の動きをわかりやすく解説【初級 深層学習講座】
Batch Normalizationの学習時と推論時の動きを理解する 【初級 深層学習講座】
畳み込み層(CNN, Conv1D)の動きをわかりやすく解説 【初級 深層学習講座】
エポック数(epoch)とステップ数(step)の違い、バッチサイズとは【初級 深層学習講座】
顔認証、深層距離学習など
PyTorchとFaceNetを使えば1対1の顔認証が手軽に作れる
FaceNetとFaissで高速な1対Nの顔認証を実装してみる|PyTorch
深層距離学習+FaissをMNISTデータセットで実践【Pytorch Metric Learning】
物体検出・セグメンテーションなど
セグメンテーション
ultralytics社のSAM(Segment Anything Model)|使い方を解説
FastSAMによるゼロショットセグメンテーション|使い方を解説
SegFormerでの学習・推論方法を解説 | セグメンテーション向けのtransformerを使う
YOLO関連
YOLO v8/YOLO v9で物体検出|独自(カスタム)データの学習と推論を実践
M1とM2 MacのGPUの実力をチェック|実行環境を構築し、YOLOv8(学習)でベンチマークしてみた
YOLOv8の物体追跡(MoT)の手法を調べてみた(パラメータなど)
YOLOv8で物体追跡を実践|YOLOv8は追跡もできるらしい
物体検出のアノテーションで楽する方法(YOLOv8+labelImg)
YOLOの出力を可視化するツール「supervision」を紹介
ゼロショットで物体検出可能なYOLOv8-Worldモデルを試す
YOLOv5を使った独自データの学習と推論を実践|ultralyticsの新リポジトリを利用
YOLO-NASで物体検出|独自(カスタム)データの学習と推論を実践
自然言語処理、LLMなど
Tokenizer
CALM2のトークナイザーの出力調査&チャットボットの作り方
Bert
Hugging Face (BERT)で回帰(Regression)
Hugging Face Transformer(BERT)でクラス分類
LLM
大規模言語モデル(Llama2/Gemma/Calm2)を動かしてみる(使い方)
擬似的な会話で大規模言語モデル(LLM)の回答を制御する方法|LLM活用テクニック
HuggingFace|大規模言語モデル(LLM)のチャットテンプレートを使う
RakutenAI-7B-chatとGradioを使ってチャットボットを作ってみた|大規模言語モデル(LLM)を試す
Sentence Transformersで文章の類似度を調べる方法
GoogleのGemmaをmacbook air(M2)で動かしてみる|大規模言語モデルを動かす
LangChain
LangChainの近傍探索ライブラリFaiss(類似検索)の使い方を解説
LangChainでRAGを試す|CALM2 + FAISS + RetrievalQAの使用例
その他
HuggingFace Transformerの精度向上テクニック | 出力のPooling手法
音声処理
OpenAIのWhisper(v3)を使った音声認識・音声翻訳・音声識別
Text2Speech, Speech2Textを繰り返すとどうなるか
ESPnet2の使い方|日本語音声認識 (Speech To Text)編
ESPnet2の使い方|日本語音声合成(Text-To-Speech)編
Mel Spectrogram|音声データを画像用のDNNに入力する方法
音/音声データを画像用DNN(CNN)で学習・推論する方法を解説
データ拡張
Audiomentations|音声データ向けデータ拡張ライブラリを解説
データ拡張(data augmentation)手法のmixupを解説|Pytorch 【初級 深層学習講座】
timmを使ってMixup/CutMixを手軽に実装する方法
Pythonでカラーノイズ(ピンクノイズ、ホワイトノイズ)を生成する
データ拡張(Data Augmentation)とは?【初級 深層学習講座】
物体検出でも使えるAlbumentationsの使い方(画像データ拡張, Data Augmentation)
PyTorch
PyTorch
データ拡張(data augmentation)手法のmixupを解説|Pytorch 【初級 深層学習講座】
音/音声データを画像用DNN(CNN)で学習・推論する方法を解説
GradCAMで判断根拠を可視化する|PyTorch(timm, resnet18)【初級 深層学習講座】
テンソル演算の可読性を向上させる、Einopsの使い方【Pytorch】
物体検出をサポートしたデータ拡張の使い方【torchvision.transofrms.v2】
PyTorchの可視化機能を紹介|物体検出枠とセグメンテーション結果を可視化
PyTroch基礎
PyTorch|テンソルの操作と基本的な演算を理解する【初級 深層学習講座】
データ変換チートシート:Pandas, Numpy, PyTorch, PIL, OpenCV
関数を自作してPyTorchの逆伝播を理解する【初級 深層学習講座】
PyTorch-独自データセット(custom dataset)の作り方【初級 深層学習講座】
手書き文字(MNIST)認識をPyTorchで記述する【初級 深層学習講座】
手書き文字(MNIST)認識をCNNでやってみる【初級 深層学習講座】
チューニング
ファインチューニングで一部のレイヤー(層)をフリーズする方法 | Kaggle TIPS
ラベル加工関連(Label Smoothing、Psudo Labeling)
Pytorch|ラベル平滑化(label smoothing)の実装方法【初級 深層学習講座】
擬似ラベリング(Pseudo Labeling)の使い方|エントロピー計算で選択する方法
Pytorch Lightning
クラス分類(犬猫分類)をPyTorch Lightningで書き直してみる
timm
timmを使ってMixup/CutMixを手軽に実装する方法
PyTorch-TIMMでモデル作成、モデル一覧を取得する方法(create_modelチートシート)
様々な手法の実装
【Pytochで実装】Model soups | 重み平均により精度向上させる手法
アンサンブルと違って処理時間が増えない精度改善手法:Model Soups
Model Soupsについて二回書いていることに気づきました・・・
PyTorch以外
PytorchユーザーがKerasを使ってみた感想|犬猫分類(resnet50のファインチューン)
Label Studioの自動アノテーション機能(AI支援)にYOLOv8を使う方法
LabelStudioの使い方を説明|おすすめの多機能アノテーションツール
物体検出のためのアノテーションツール | labelImgの使い方を説明
Kaggle
Kaggleの公開ノートブックを日本語に翻訳するChrome拡張機能を紹介
HuggingFace Transformerの精度向上テクニック | 出力のPooling手法
ファインチューニングで一部のレイヤー(層)をフリーズする方法 | Kaggle TIPS
Google Colab活用ガイド|kaggleとColabでコードを共有
LLM Prompt Recoveryに挑戦| Kaggleチャレンジ記録
BirdCLEF 2024に挑戦| Kaggleチャレンジ記録