チューリングの新技術
2025-01-22 13:37:33

チューリングが革命を起こす!AI向け視覚データ圧縮技術を公開

チューリングがもたらす次世代AI向け視覚データ圧縮技術



東京都品川区に本社を置くTuring株式会社は、動画や画像などの大規模な視覚データを効率的に圧縮し、それをAIが扱うのに最適な形で高精度に保持できる画期的な技術を開発しました。この技術は現在特許出願中で、AI分野におけるデータの活用方法に大きな革命をもたらすことが期待されています。

背景と必要性


近年、マルチモーダル大規模言語モデル(MLLMs)が注目を集める中、AIの発展には膨大な量のデータを効率よく処理する技術が求められています。特に、自動運転AIやマルチモーダルAIでは、複数の種類のデータを同時に取り扱うことが必要です。しかし、従来の技術では、AIに最適化したかたちで情報を伝えることが難しく、これがデータ利用の障壁となっていました。

新技術の概要


チューリングの新技術は、膨大なデータの圧縮と情報保持を両立させるために、独自の手法を講じています。具体的には、テキストや画像から得られた情報をトークンというAIが処理できる最小単位に変換し、必要に応じてその長さを調整できる「可変長圧縮」を導入。これにより、情報の質を保ちながらデータサイズを大幅に削減できるのです。

この技術の肝となるのが「Tail Token Drop」という手法で、学習段階でトークン列の末尾をランダムに削除し、その結果を比較することでAIモデルを最適化します。これにより、トークン列の先頭に重要情報が集約され、圧縮過程においても必要なデータが失われにくくなります。

加えて、この技術はトークン列から画像を再構成することも可能で、JPEGやWebPなどの従来フォーマットよりも小さいデータ量で、高品質な画像を生成します。

今後の応用と期待


今後、この技術は自動運転やクラウド関連システムなど、リアルタイム性が求められる分野への応用が期待されています。自動運転では、車載カメラから得られる映像を圧縮し、AIが迅速に情報を処理することで、高精度かつリアルタイムな周囲の判断が可能になるでしょう。この技術を用いることで、計算にかかる時間を大幅に短縮し、自動車の自動運転基盤の革新が期待されます。

また、MLLMsや世界モデル入出力にもこの技術が活用されることで、言語と画像の両方を同時に扱うことが可能になり、データ処理の負荷が軽減されつつ、全体の精度が維持されることが見込まれています。

まとめ


チューリングが開発した新しい視覚データ圧縮技術は、AIや自動運転の未来に多大な影響を及ぼす可能性を秘めています。特許出願中のこの技術は、すでに論文『One-D-Piece: Image Tokenizer Meets Quality-Controllable Compression』として公開されており、さらなる詳細や技術的解説はチューリングのテックブログでも確認できます。興味がある方は、ぜひ一度チェックしてみてください。


この革新的な技術が、今後どれほどの変化をもたらすのか、我々は目を離せません。


画像1

画像2

関連リンク

サードペディア百科事典: AI技術 チューリング 視覚データ

トピックス(その他)

【記事の利用について】

タイトルと記事文章は、記事のあるページにリンクを張っていただければ、無料で利用できます。
※画像は、利用できませんのでご注意ください。

【リンクついて】

リンクフリーです。