object detection

2022年のGoogleのAI研究の成果と今後の展望～言語・視覚・生成モデル編～(2/5)

１．2022年のGoogleのAI研究の成果と今後の展望～言語・視覚・生成モデル編～(2/5)まとめ・MaxViTはオリジナルのVision Transformerの計算量削減に成功し、より効率的に規模を拡大可能にした・Pix2Seqは物体...

2023.01.21

AI関連その他

１．FindIt：テキストの指示に基づいて画像内からサンドイッチの左半分を特定可能な統合モデル(2/2)まとめ・３つのタスク全てを同じ入力を取るように適応させ学習の効率化を行った・全てのタスクに対して標準的な物体検出損失を使ったが驚くほど効...

2022.09.28

モデル基礎理論

１．Pix2Seq：言語モデルを使って物体検出を行う(2/2)まとめ・Pix2Seqでは物体検出を言語モデリングタスクとみなしており特別な設計をしていない・システムの出力が比較的簡潔なトークンの並びで表現されるような領域に応用可能・幅広い視...

2022.05.12

モデル学習手法

１．Pix2Seq：言語モデルを使って物体検出を行う(1/2)まとめ・物体検出タスクを行う従来のアプローチは高度にカスタマイズされており汎用性がない・物体検出タスクを画素を入力とする言語モデリングタスクとみなすPix2Seqを考案・Pix2...

2022.05.11

モデル学習手法

１．画像や動画関係の機械学習に使用できる大規模データセット一覧(2/2)まとめ・動画や顔認証用、性別や年齢推定、ポーズ推定などの学習に使えるデータセットがある・「モデルアーキテクチャ」「GPU」「データセット」の観点から性能を試算する必要が...

2021.08.28

データセット

１．画像や動画関係の機械学習に使用できる大規模データセット一覧(1/2)まとめ・画像関連のニューラルネットワークをトレーニングするには大規模画像データセットが必要・ImageNetは最もよく知られている画像データセットで画像研究のゴールドス...

2021.08.27

データセット

１．RetinaGAN：シミュレーション環境から現実世界への転移を一般化(2/2)まとめ・RL-CycleGAN は「タスクレベルの物体認識」を使用してsim-to-realギャップを超える・RetinaGANは「ロボットの物体認識」に着目...

2021.06.10

学習手法

１．2021年時点の各分野における最先端の機械学習モデルの紹介まとめ・未知の分野で作業を始める時、現時点の最先端モデルを調べるのは時間がかかる・各MLタスクに最適なモデルをリスト化してまとめておくと手間がかなり省ける・Kaggleのコンテス...

2021.04.28

モデル

１．独自データを使って物体検出モデルの精度を上げる方法(2020年版)まとめ・2020年に物体検出モデルを再トレーニングしようとした時に取りうる選択肢の概要紹介・物体検出用データのラベル付け、データ拡張、モデリングなどを具体的に紹介・物体検...

2021.04.10

AI関連その他モデル

１．SpineNet：ニューラルアーキテクチャ探索で発見された新しい物体検出アーキテクチャ(2/2)まとめ・ニューラルアーキテクチャ探索の出発点となるモデルにはResNet-50バックボーンを採用・発見されたスケール交換モデルは、物体検出タ...

2020.07.12

モデル

１．SpineNet：ニューラルアーキテクチャ探索で発見された新しい物体検出アーキテクチャ(1/2)まとめ・畳み込みネットワークは段階的に入力画像のスケールを削減するためマルチスケールなタスクが苦手・スケール交換モデルはスケールを削減ではな...

2020.07.11

モデル

１．Context R-CNN：過去に撮影された写真を参照して仕掛けカメラの物体検出能力を改善(2/2)まとめ・Context R-CNNはFaster R-CNNアーキテクチャの中にコンテキストメモリバンクを汲み込んで実現・コンテキストメ...

2020.07.10

学習手法