コンピュータビジョンとは?

読み方: コンピュータビジョン

30秒まとめ

画像や動画をコンピュータに理解・分析させるAI技術の分野。自動運転や医療画像診断に応用。

コンピュータビジョンの意味・定義

コンピュータビジョン(Computer Vision)は、コンピュータに画像や動画を「見て理解する」能力を与えるAI技術の分野です。物体検出、画像分類、顔認識、セグメンテーション(領域分割)、姿勢推定、光学文字認識(OCR)など、多岐にわたるタスクを含みます。ディープラーニングの発展により、特にCNN(畳み込みニューラルネットワーク)やVision Transformerの登場以降、精度が飛躍的に向上しました。自動運転、医療画像診断、製造業の品質検査、監視カメラ、ARアプリケーション、小売業の無人レジなど、実社会での応用が急速に広がっています。GPT-4o、Claude、Geminiなどの最新LLMもマルチモーダル機能として画像理解能力を備えており、画像の内容を説明したり、画像に基づいて質問に回答したりすることが可能です。

関連するAIツール

関連する用語

運営者が開発したAIマーケティングツール