TOON 紹介

TOON とは?

LLM 時代のために特別に設計されたデータ形式、TOON (Token-Oriented Object Notation) を活用しましょう。トークン効率の高いシリアライズにより、AI との対話を最適化します。

TOON とは?

TOON (Token-Oriented Object Notation) は、大規模言語モデル (LLM) 用に特別に設計された、コンパクトなテキストベースのデータシリアライズ形式です。マシン間の通信用に設計された従来の JSON や XML とは異なり、TOON は「トークン」消費を最小限に抑えるように最適化されています。繰り返されるキーや過剰な句読点などの冗長な構文を取り除き、AI モデルがデータをより「消化」しやすくします。

用途は何ですか?

TOON の主な目的は、人間(またはシステム)と LLM の間の相互作用を最適化することです。主なユースケースは次のとおりです。

コスト削減

データを表現するために必要なトークン数を減らすことで、LLM API(GPT-4 や Claude など)の使用コストを直接削減します。

コンテキストウィンドウの拡張

限られたコンテキストウィンドウ内に、より多くの情報(最大 2〜3 倍のデータ量)を収めることができます。

推論能力の向上

構造化されたテーブル形式のレイアウトにより、モデルがデータポイント間の関係をよりよく理解できるようになり、データ抽出や分析タスクの精度が向上します。

主な特徴

TOON は、AI モデルのパフォーマンスに合わせて調整された独自の機能を提供します。

トークン効率

配列内の繰り返されるキーや不要な引用符/中括弧を排除します。

LLM フレンドリーな構造

LLM の「アテンション」メカニズムに合わせたインデントとヘッダーを使用します。

スキーマ対応配列

オブジェクトごとにキーを繰り返すのではなく、リストの先頭で一度だけ構造(キー)を定義します。

厳密なカウント

配列の長さ(例:items[5])を明示的に含めることで、モデルがデータの整合性を検証し、余分な項目の「ハルシネーション」を防ぐのに役立ちます。

構文規則

TOON は YAML のシンプルさと CSV の構造を融合させています。

1

オブジェクト

インデントとコロンを使用します(YAML に似ています)。

2

配列

長さと中括弧内のヘッダーで定義されます。

3

単純な文字列の場合、引用符は任意です。行末にカンマは不要です。

example.toon
user:
  id: 101
  name: Alice
  tags: [3]{id, label}:
    1, developer
    2, tech-lead
    3, remote

TOON vs JSON 比較

TOON と業界標準の JSON 形式を比較します。

特徴JSONTOON
トークン使用量多い(括弧/引用符によるオーバーヘッドが大きい)少ない(密度が最適化されている)
冗長性リスト内のすべてのオブジェクトでキーが繰り返されるリストごとにキーは一度だけ宣言される
可読性開発者向けの標準LLM と人間にとって高い可読性
データの整合性暗黙的明示的([n] のようなカウントを使用)
主な目的一般的なデータ交換LLM の効率化

使用の推奨事項

どのような場合に他の形式よりも TOON を選択すべきか。

使用すべき場合

  • LLM に大規模なデータセット(製品リスト、ユーザー、ログなど)を送信する場合
  • モデルのコンテキスト制限に達しそうな場合
  • 構造化データを頻繁に処理する必要がある AI エージェントを構築する場合

避けるべき場合

  • JSON が業界標準である標準的な Web 開発(ブラウザとサーバ間の通信)の場合
  • トークンの節約が無視できるほど単純な、入れ子になっていないデータの場合