MITの最新のコンピュータービジョンアルゴリズムは、ピクセルまでの画像を識別します – engadget.com


具体的に言うと、トレーニング画像に手作業でラベルを付けるのに約800時間かかります。
機械が人々の行動をよりよく理解できるように、MIT CSAILの研究者チームは、コーネル大学とMicrosoftと共同で、個々のピクセルまでの画像を識別できるアルゴリズムであるSTEGOを開発しました。
この手法では、画像内の各ピクセルにクラスラベルを適用して、AIに周囲の世界をより正確に表示します。
ラベル付きボックスには、ボックス化された境界内の周囲のピクセルにオブジェクトと他のアイテムが含まれますが、セマンティックセグメンテーションでは、オブジェクト内のすべてのピクセルにラベルが付けられますが、オブジェクトを構成するピクセルのみがラベル付けされます。
これに、1つの256×256画像を構成する65,536の個別のピクセルを掛けます。

コメント

タイトルとURLをコピーしました