- PyTorch
- Facebook AI Research (FAIR) が開発したオープンソースの機械学習ライブラリです。動的な計算グラフを特徴とし、柔軟なモデル構築とデバッグの容易さから、研究開発分野で広く利用されています。
- TensorFlow
- Googleによって開発されたオープンソースの機械学習ライブラリです。大規模なプロダクション環境での利用に強く、幅広いプラットフォームに対応しています。静的な計算グラフを採用しています。
- Pandas
- Pythonでデータ分析を行うためのライブラリです。データフレームという強力なデータ構造を提供し、データの読み込み、整形、加工、集計など、多岐にわたるデータ前処理を効率的に行えます。
- Scikit-learn
- Pythonのオープンソース機械学習ライブラリです。分類、回帰、クラスタリング、次元削減などの多様なアルゴリズムを提供し、機械学習の基本的なタスクを簡潔に実装できます。
- ニューラルネットワーク
- 人間の脳の神経回路を模倣した情報処理モデルです。入力層、隠れ層、出力層から構成され、層間の重みとバイアスを調整することで、複雑なパターン認識や予測を行います。
- 画像分類
- 画像に何が写っているかを識別するAIタスクです。与えられた画像が、事前に定義された複数のカテゴリのうちどれに属するかを予測します。深層学習のCNNがよく用いられます。
- セグメンテーション
- 画像内の各ピクセルがどの物体に属するかを識別するAIタスクです。画像分類よりも詳細な情報を提供し、自動運転や医療画像診断などで活用されます。
- 異常検知
- データセットの中から、通常のパターンから著しく逸脱したデータ(異常値)を識別するAIタスクです。製造業の不良品検出、金融取引の不正検出、システム監視などに利用されます。
- ファインチューニング
- 事前に大規模なデータで学習されたAIモデル(事前学習モデル)を、特定のタスクやデータセットに合わせて再学習させる手法です。少ないデータで高い性能を達成できます。
- ONNX
- Open Neural Network Exchangeの略称で、AIモデルの中間表現フォーマットです。異なる深層学習フレームワーク間でモデルを交換し、推論エンジンで最適化・高速化するために使用されます。
- エッジAI
- AIモデルの推論処理を、クラウドではなくデバイス(エッジデバイス)上で行う技術です。低遅延、プライバシー保護、通信コスト削減などの利点があります。
- Streamlit
- Pythonでデータアプリケーションや機械学習Webアプリケーションを迅速に作成するためのオープンソースフレームワークです。少ないコードでインタラクティブなUIを構築できます。
- Docker
- アプリケーションとその実行環境をコンテナと呼ばれる軽量な仮想環境にパッケージ化する技術です。環境構築の再現性を高め、開発からデプロイまでを効率化します。
- CUDA
- NVIDIAが開発した、GPU上で汎用計算を行うための並列コンピューティングプラットフォームです。深層学習の計算を大幅に高速化するために広く利用されています。
- LangChain
- 大規模言語モデル(LLM)を利用したアプリケーション開発を効率化するためのフレームワークです。プロンプト管理、外部ツール連携、記憶機能などを提供します。
- データ前処理
- AIモデルに入力する生データを、モデルが学習しやすい形式に変換する一連の工程です。欠損値処理、特徴量エンジニアリング、正規化などが含まれます。
- 最適化アルゴリズム
- 機械学習モデルの学習において、モデルのパラメータを調整し、損失関数を最小化するためのアルゴリズムです。勾配降下法、Adam、SGDなどが代表的です。
- 回帰分析
- 連続値の目的変数を予測するための統計的手法および機械学習タスクです。線形回帰、ロジスティック回帰、決定木回帰などがあります。
- クラスタリング
- データセット内の類似したデータをグループ(クラスター)に分割する機械学習タスクです。教師なし学習の一種で、K-means、DBSCANなどが代表的な手法です。
- アノテーション
- AIモデルの学習データとして使用するために、画像、テキスト、音声などのデータにラベルやタグを付与する作業です。AIの性能に直結するため、効率化が重要です。