AI投資マシン:パート1
- Claude Paugh

- 7 時間前
- 読了時間: 5分
数年前、私は投資信託とその保有資産、そしてその保有資産を裏付けている法人に関するナレッジグラフを作成するというアイデアを思いつきました。そこで、 Couchbaseウェアハウスに保存していたSEC提出書類のデータに基づいて、Neo4Jでグラフを構築し始めました。
私は数年間にわたり投資信託とETFの保有に関する書類を蓄積してきましたが、その品質は2021年以降大幅に向上しました。2023年頃には、ナレッジグラフを構築できるだけの書類が集まりましたが、私のユースケースはナレッジグラフに必ずしも適したものではありませんでした。
なぜでしょうか?当初のユースケースに加えて、機械学習のケース用に維持したい履歴データがありました。初期セットアップではKISSに準拠するため、とにかくすべてをNeo4Jに保存することにしました。Neo4Jは処理の多くをメモリにロードしようとするため、ノード数が多いと問題が発生することがあります。

SECからの提出書類(主にN-PORTフォーム)のロードを当初計画した際、Couchbaseのメモリとストレージの消費量を削減するため、XMLからJSONへの構造化をしたいと考えました。これは、JSONを検索するためのキーのインベントリを作成することを意味し、これはNeo4Jのノード構造にも反映されます。提出書類には、提出日、裏付けとなるCIK(SECの中央インデックスキー)、そして一般的な証券/金融商品識別子(ISIN、CUSIP、SEDOL)、そして取引からの内部識別子が含まれています。しかし、SECは最も重要な新しいキー、LEI(取引主体識別子)を追加しました。
保有されている様々な証券間の関係性や、それらを裏付ける法的構造を解明するための情報源ができました。そこで、唯一の公開情報源であるhttps://www.gleif.org/enからLEI情報を取り込むことにしました。
ナレッジグラフのノード、関係、属性を表示する画像
ナレッジグラフは、特定の質問に答えるために、以下のノードタイプと関係性に基づいて構築されています。これは、ノードや関係性の完全なリストではありません。範囲の概要を示すためのものです。
ノード
普通株式 | 変動金利債務 | 先物 | 資金 |
優先株 | 担保付債務 | スワップ | ファンド親会社 |
企業債務 | 資産担保債務 | スワプション | 資金借り手 |
住宅ローン担保債務 | ワラント | 国 | 法人 |
地方債 | オプション | 通貨 | 法人LEI ISIN参照 |
転換社債 | フォワード | 地域 | 法人関係 |
人間関係
資産タイプ -> ファンド保有 | 資産タイプ -> 法人 | 資産の種類 -> 法的管轄 | ファンドシリーズ -> ファンドシリーズクラス |
資産タイプ -> 国 | ファンド -> 法人 | 資産タイプ -> 本社所在地国 | ファンド -> ファンドフロー |
資産タイプ -> 通貨 | ファンド親会社 -> 法人 | 資産タイプ -> 所在地国 | ファンド -> ファンドパフォーマンス |
国 -> 地域 | ファンド -> サブファンド | 資産タイプ -> インデックスメンバー | 普通株式 -> 会社概要 |
明示的に定義された多対多の法人を解決する他の関係も存在します。
当初、このデータの組み合わせのユースケースの目的は次のとおりです。
通貨エクスポージャーのリスク測定
機関投資家や市場に対するポジションリスク
多国籍企業の法人追跡
資産購入の影響連鎖とは何か
この仕組みの一部を実証するために、Neo4J Bloomでファンドを拡大することから始めました。このファンドは、ローンとスワップションを資産として保有しています。


次に、スワップションによってラップされた基礎となるスワップ資産の法人(LE)は、シティグループ グローバル マーケッツという会社に遡るスワップのカウンターパーティでした。

それ自体は、Citigroup Financial Products と呼ばれる別の Citigroup LE の傘下でした。

次に、上記の Citigroup 社が拡張され、複数のレポ契約の法人および非中央清算 (NCC) のカウンターパーティ、および変動金利債務の法人であることが明らかになりました。

レポ契約をもう少し詳しく見てみると、最終的に資産保有者(この場合は2つの投資信託)にリンクしていることがわかります。(銀行アイコンが付いた薄緑色のオブジェクト)また、レポ契約通貨/担保通貨としてユーロが示されています。
これは、シティグループ関連会社がユーロ通貨へのエクスポージャーを有しており、これらの資産の為替レートの大幅な変動の影響を受ける可能性があることを意味します。ユーロ通貨へのエクスポージャーに関しては、2つの投資信託についても同様の状況です。多くの投資信託やETFは、為替リスクを先物取引で相殺しています。もし私がこのケースでファンドを拡大し、それらが米国に拠点を置いていたとしたら、これらの「先物取引」はファンドが保有する資産として扱われるでしょう。

シティグループ・ファイナンシャル・プロダクツの法人組織から別の経路を辿ると、別の持株会社傘下で他国で事業を展開している企業群に辿り着きます。最初のオレンジ色の円は、様々なファンドが関連しているファンド会社です(右側の4つのオレンジ色の円)。

最後に、上記の資産と資金を管理する Citigroup Financial Products LE を、階層の最上位にある Citigroup Inc. LE まで遡ります。

ご覧のとおり、異なる組織とその基盤構造間で取引主体識別子(LEI)をマッピングする機能は、容易に発見できないリスクをナビゲート、評価、追跡、そして理解する能力に大きな影響を与える可能性があります。組織や金融システム全体への影響を定量化する強力な機能を備えているため、私はこれをAIアプリケーション構築の基盤として活用しました。次に、アプリケーションのアーキテクチャを詳しく検証し、私が求めていた機能をさらに反映させるために、その範囲を拡張していきます。














