このページは前リリースの情報です。該当の英語のページはこのリリースで削除されています。

オブジェクトの検出

畳み込みニューラルネットワーク (CNN または ConvNet) を使用した分類、オブジェクト検出、転移学習の実行、ならびにカスタム検出器の作成

オブジェクト検出は、イメージまたはビデオ内のオブジェクトのインスタンスを特定するためのコンピュータービジョンの手法です。オブジェクト検出アルゴリズムは通常、機械学習または深層学習を活用して、意味のある結果を生成します。イメージやビデオを見るとき、人間は関心を向ける対象オブジェクトを瞬時に認識して特定できます。オブジェクト検出の目的は、コンピューターを使用してこのインテリジェンスを模倣することです。オブジェクト検出の最適なアプローチは、アプリケーションや解決しようとする問題によって異なります。

深層学習手法では、多数のラベル付き学習イメージを必要とするため、モデルに学習させるのに必要な時間を短縮するために GPU を使用することを推奨します。深層学習ベースのオブジェクト検出では、R-CNN や YOLO などの畳み込みニューラルネットワーク (CNN または ConvNet) を使用するか、シングルショット検出 (SSD) を使用します。カスタムオブジェクト検出器に学習させることも、転移学習を活用して事前学習済みのオブジェクト検出器を使用し、事前学習済みのネットワークから始めて、アプリケーションに合わせて微調整することもできます。畳み込みニューラルネットワークには Deep Learning Toolbox™ が必要です。学習と予測は CUDA^® 対応 GPU でサポートされます。GPU を使用することが推奨され、これには Parallel Computing Toolbox™ が必要になります。詳細については、Computer Vision Toolbox の基本設定およびMathWorks 製品での並列計算のサポート (Parallel Computing Toolbox)を参照してください。

オブジェクト検出の機械学習手法には、集約チャネル特徴 (ACF)、勾配方向ヒストグラム (HOG) 特徴を使用したサポートベクターマシン (SVM) 分類、および人間の顔や上半身を検出するための Viola-Jones アルゴリズムなどがあります。事前学習済みのオブジェクト検出器から開始することも、アプリケーションに合わせてカスタムオブジェクト検出器を作成することもできます。

Labeled boats, neural network, and person detector

アプリ

イメージラベラー	コンピュータービジョンアプリケーションに使用するラベルイメージ
ビデオラベラー	Label video for computer vision applications

関数

すべて展開する

オブジェクトの検出

深層学習検出器

`rcnnObjectDetector`	R-CNN 深層学習の検出器を使用したオブジェクトの検出
`fastRCNNObjectDetector`	Detect objects using Fast R-CNN deep learning detector
`fasterRCNNObjectDetector`	Faster R-CNN 深層学習の検出器を使用したオブジェクトの検出
`ssdObjectDetector`	Detect objects using SSD deep learning detector (R2020a 以降)
`yolov2ObjectDetector`	Detect objects using YOLO v2 object detector
`yolov3ObjectDetector`	Detect objects using YOLO v3 object detector (R2021a 以降)
`yolov4ObjectDetector`	Detect objects using YOLO v4 object detector (R2022a 以降)
`solov2`	Segment objects using SOLOv2 instance segmentation network (R2023b 以降)
`maskrcnn`	Detect objects using Mask R-CNN instance segmentation (R2021b 以降)
`ocr`	光学式文字認識を使用したテキストの認識

特徴ベースの検出器

`readAprilTag`	Detect and estimate pose for AprilTag in image (R2020b 以降)
`readBarcode`	Detect and decode 1-D or 2-D barcode in image (R2020a 以降)
`acfObjectDetector`	Detect objects using aggregate channel features
`peopleDetectorACF`	集約チャネル特徴を使用した人物の検出
`vision.CascadeObjectDetector`	Viola-Jones アルゴリズムを使用したオブジェクトの検出
`vision.ForegroundDetector`	混合ガウスモデルを使用した前景の検出
`vision.PeopleDetector`	HOG 特徴を使用した直立の人物の検出
`vision.BlobAnalysis`	連結された領域のプロパティ

特徴点を使用したオブジェクトの検出

`detectBRISKFeatures`	BRISK 特徴の検出
`detectFASTFeatures`	FAST アルゴリズムを使用したコーナーの検出
`detectHarrisFeatures`	Harris–Stephens アルゴリズムを使用したコーナーの検出
`detectKAZEFeatures`	KAZE 特徴の検出
`detectMinEigenFeatures`	最小固有値アルゴリズムを使用したコーナーの検出
`detectMSERFeatures`	MSER 特徴の検出
`detectORBFeatures`	ORB キーポイントの検出
`detectSIFTFeatures`	Scale Invariant Feature Transform (SIFT) 特徴の検出 (R2021b 以降)
`detectSURFFeatures`	SURF 特徴の検出
`extractFeatures`	関心点記述子の抽出
`matchFeatures`	マッチする特徴の検出

検出オブジェクトの選択

`selectStrongestBbox`	Select strongest bounding boxes from overlapping clusters using nonmaximal suppression (NMS)
`selectStrongestBboxMulticlass`	Select strongest multiclass bounding boxes from overlapping clusters using nonmaximal suppression (NMS)

カスタムオブジェクト検出器の学習

学習データの読み込み

`boxLabelDatastore`	Datastore for bounding box label data (R2019b 以降)
`groundTruth`	グラウンドトゥルースラベルデータ
`imageDatastore`	イメージデータのデータストア
`objectDetectorTrainingData`	オブジェクト検出器用の学習データの作成
`ocrTrainingOptions`	Options for training OCR model (R2023a 以降)
`combine`	複数のデータストアのデータを統合

特徴ベースのオブジェクト検出器の学習

`trainACFObjectDetector`	ACF オブジェクト検出器に学習させる
`trainCascadeObjectDetector`	カスケード型オブジェクト検出器モデルの学習
`trainImageCategoryClassifier`	イメージカテゴリ分類器の学習

深層学習ベースのオブジェクト検出器の学習

`trainRCNNObjectDetector`	R-CNN 深層学習オブジェクト検出器の学習
`trainFastRCNNObjectDetector`	Fast R-CNN 深層学習オブジェクト検出器の学習
`trainFasterRCNNObjectDetector`	Faster R-CNN 深層学習オブジェクト検出器の学習
`trainSSDObjectDetector`	Train an SSD deep learning object detector (R2020a 以降)
`trainYOLOv2ObjectDetector`	Train YOLO v2 object detector
`trainYOLOv4ObjectDetector`	Train YOLO v4 object detector (R2022a 以降)
`trainSOLOV2`	Train SOLOv2 network to perform instance segmentation (R2023b 以降)
`trainMaskRCNN`	Train Mask R-CNN network to perform instance segmentation (R2022a 以降)
`ocrTrainingOptions`	Options for training OCR model (R2023a 以降)
`trainOCR`	Train OCR model to recognize text in image (R2023a 以降)
`quantizeOCR`	Quantize OCR model (R2023a 以降)

深層学習用の学習データの拡張と前処理

`balanceBoxLabels`	Balance bounding box labels for object detection (R2020a 以降)
`bboxcrop`	境界ボックスのトリミング (R2019b 以降)
`bboxerase`	Remove bounding boxes (R2021a 以降)
`bboxresize`	境界ボックスのサイズ変更 (R2019b 以降)
`bboxwarp`	Apply geometric transformation to bounding boxes (R2019b 以降)
`bbox2points`	Convert rectangle to corner points list
`imwarp`	イメージへの幾何学的変換の適用
`imcrop`	イメージのトリミング
`imresize`	イメージのサイズ変更
`randomAffine2d`	ランダムな 2 次元アフィン変換の作成 (R2019b 以降)
`centerCropWindow2d`	四角形の中央トリミングウィンドウの作成 (R2019b 以降)
`randomWindow2d`	Randomly select rectangular region in image (R2021a 以降)
`integralImage`	2 次元インテグラルイメージの計算

オブジェクト検出の深層ニューラルネットワークの設計

R-CNN (Regions with Convolutional Neural Networks)

`rcnnBoxRegressionLayer`	Box regression layer for Fast and Faster R-CNN
`fasterRCNNLayers`	Create a faster R-CNN object detection network (R2019b 以降)
`rpnSoftmaxLayer`	Softmax layer for region proposal network (RPN)
`rpnClassificationLayer`	Classification layer for region proposal networks (RPNs)
`regionProposalLayer`	Region proposal layer for Faster R-CNN
`roiAlignLayer`	Non-quantized ROI pooling layer for Mask-CNN (R2020b 以降)
`roiInputLayer`	ROI input layer for Fast R-CNN
`roiMaxPooling2dLayer`	Neural network layer used to output fixed-size feature maps for rectangular ROIs
`roialign`	Non-quantized ROI pooling of `dlarray` data (R2021b 以降)

YOLO v2 (You Only Look Once version 2)

`yolov2Layers`	Create YOLO v2 object detection network
`yolov2TransformLayer`	Create transform layer for YOLO v2 object detection network
`yolov2OutputLayer`	Create output layer for YOLO v2 object detection network
`spaceToDepthLayer`	空間から深さへの変換層 (R2020b 以降)

焦点損失層

`focalLossLayer`	(To be removed) Create focal loss layer using focal loss function (R2020a 以降)
`focalCrossEntropy`	Compute focal cross-entropy loss (R2020b 以降)

SSD (シングルショット検出器)

ssdMergeLayer Create SSD merge layer for object detection (R2020a 以降)

アンカーボックス

estimateAnchorBoxes Estimate anchor boxes for deep learning object detectors (R2019b 以降)

検出結果の可視化

`cuboid2img`	Project cuboids from 3-D world coordinates to 2-D image coordinates (R2022b 以降)
`insertObjectAnnotation`	トゥルーカラーイメージ、グレースケールイメージ、またはビデオへの注釈付け
`insertObjectMask`	Insert masks in image or video stream (R2020b 以降)
`insertShape`	イメージまたはビデオへの形状の挿入
`showShape`	Display shapes on image, video, or point cloud (R2020b 以降)

予測結果の評価

`evaluateObjectDetection`	Evaluate object detection data set against ground truth (R2023b 以降)
`objectDetectionMetrics`	Object detection quality metrics (R2023b 以降)
`evaluateInstanceSegmentation`	Evaluate instance segmentation data set against ground truth (R2022b 以降)
`instanceSegmentationMetrics`	Instance segmentation quality metrics (R2022b 以降)
`bboxOverlapRatio`	境界ボックスのオーバーラップ率の計算
`bboxPrecisionRecall`	Compute bounding box precision and recall against ground truth
`evaluateOCR`	Evaluate OCR results against ground truth (R2023a 以降)
`evaluateDetectionMissRate`	(To be removed) Evaluate miss rate metric for object detection
`evaluateDetectionPrecision`	(削除予定) オブジェクト検出の適合率メトリクスの評価
`evaluateDetectionAOS`	(To be removed) Evaluate average orientation similarity metric for object detection (R2020a 以降)

ブロック

Deep Learning Object Detector

学習済み深層学習オブジェクト検出器を使用したオブジェクトの検出 (R2021b 以降)

トピック

開始

深層学習を使用したオブジェクト検出入門
深層学習ニューラルネットワークを使用して、オブジェクト検出とインスタンスセグメンテーションを実行する。
オブジェクト検出器の選択
オブジェクト検出モデルとインスタンスセグメンテーションモデルを比較する。
局所特徴の検出と抽出
局所特徴の検出と抽出の利点と用途の学習。
カスケード型オブジェクト検出器入門
カスタム分類器の学習
特徴点のタイプ
いくつかの種類の特徴の点オブジェクトを返したり受け入れたりする関数の選択。
Getting Started with OCR
Detect and recognize text in multiple languages, train OCR models to recognize custom text.
bag of visual words を用いたイメージの分類
Computer Vision Toolbox™ 関数を使用して bag of visual words を作成することで、イメージをカテゴリに分類します。
座標系
ピクセルインデックス、空間座標および 3 次元座標系の指定

オブジェクト検出用およびインスタンスのセグメンテーション用の学習データ

イメージラベラー入門
四角形の ROI (オブジェクト検出用)、ピクセル (セマンティックセグメンテーション用)、多角形 (インスタンスセグメンテーション用)、およびシーン (イメージ分類用) に対話形式でラベルを付ける。
ビデオラベラー入門
ビデオおよびイメージのシーケンス内の四角形の ROI (オブジェクト検出用)、ピクセル (セマンティックセグメンテーション用)、多角形 (インスタンスセグメンテーション用)、およびシーン (イメージ分類用) に対話形式でラベルを付ける。
深層学習用のデータストア (Deep Learning Toolbox)
深層学習アプリケーションでデータストアを使用する方法を学びます。
Get Started with SOLOv2 for Instance Segmentation
Perform multiclass instance segmentation using SOLOv2 and deep learning.
インスタンスセグメンテーションの Mask R-CNN 入門
Mask R-CNN と深層学習を使用してマルチクラスインスタンスセグメンテーションを実行する。
オブジェクト検出およびセマンティックセグメンテーション用の学習データ
イメージラベラーやビデオラベラーを使用して、オブジェクト検出器やセマンティックセグメンテーションの学習データを作成します。
深層学習用イメージ前処理とイメージ拡張の入門
サイズ変更などの確定的演算を使用して深層学習アプリケーション用にデータを前処理する。あるいは、ランダムトリミングなどのランダム演算を使用して学習データを拡張する。

深層学習入門

ディープネットワークデザイナー (Deep Learning Toolbox)
深層学習層の一覧 (Deep Learning Toolbox)
MATLAB^® のすべての深層学習層を確認できます。
MATLAB による深層学習 (Deep Learning Toolbox)
畳み込みニューラルネットワークを使用して分類や回帰を行う MATLAB の深層学習機能を確認します。これには、事前学習済みのネットワークと転移学習のほか、GPU、CPU、クラスター、およびクラウドでの学習が含まれます。
事前学習済みの深層ニューラルネットワーク (Deep Learning Toolbox)
分類、転移学習、特徴抽出用の事前学習済みの畳み込みニューラルネットワークのダウンロード方法と使用方法を学習します。