コンピュータビジョンとは?
読み方: コンピュータビジョン
30秒まとめ
画像や動画をコンピュータに理解・分析させるAI技術の分野。自動運転や医療画像診断に応用。
コンピュータビジョンの意味・定義
コンピュータビジョン(Computer Vision)は、コンピュータに画像や動画を「見て理解する」能力を与えるAI技術の分野です。物体検出、画像分類、顔認識、セグメンテーション(領域分割)、姿勢推定、光学文字認識(OCR)など、多岐にわたるタスクを含みます。ディープラーニングの発展により、特にCNN(畳み込みニューラルネットワーク)やVision Transformerの登場以降、精度が飛躍的に向上しました。自動運転、医療画像診断、製造業の品質検査、監視カメラ、ARアプリケーション、小売業の無人レジなど、実社会での応用が急速に広がっています。GPT-4o、Claude、Geminiなどの最新LLMもマルチモーダル機能として画像理解能力を備えており、画像の内容を説明したり、画像に基づいて質問に回答したりすることが可能です。