top of page

Máquina de Investimento com IA: Parte I

Há alguns anos, tive a ideia de criar um grafo de conhecimento sobre fundos mútuos, suas participações e as entidades jurídicas que as sustentavam. Então, comecei a construir um grafo no Neo4j com base nos dados que eu armazenava para os registros da SEC no meu data warehouse do Couchbase .


Eu havia acumulado vários anos de registros de participações em fundos mútuos e ETFs, mas a qualidade deles melhorou significativamente a partir de 2021. Por volta de 2023, eu tinha registros suficientes para construir um grafo de conhecimento, mas meu caso de uso não era exatamente adequado para esse tipo de ferramenta.


Por quê? Eu tinha dados históricos que queria manter para aplicações de aprendizado de máquina, além do meu caso de uso inicial. Decidi prosseguir e armazenar tudo no Neo4j de qualquer maneira, seguindo o princípio KISS (Keep It Simple, Stupid - Mantenha Simples, Idiota) na minha configuração inicial. Como o Neo4j tenta carregar grande parte do que faz na memória, isso pode ser um desafio com um grande número de nós.


Visão do bloom do Neo4j
Visão do bloom do Neo4j

Quando comecei a planejar o carregamento dos arquivos, principalmente formulários N-PORT, da SEC, meu objetivo era reestruturá-los de XML para JSON, a fim de reduzir o consumo de memória e armazenamento no Couchbase. Isso significava criar um inventário de chaves para pesquisar no JSON, que também eram utilizadas nas estruturas de nós do Neo4j. Os arquivos contêm as datas de registro, a CIK (chave de índice central da SEC) e os identificadores típicos de títulos/instrumentos: ISIN, CUSIP, SEDOL e identificadores internos das negociações. Mas a SEC adicionou a chave mais importante: o LEI, ou Identificador de Entidade Legal.


Agora havia uma fonte para resolver as relações entre diferentes instrumentos detidos e qual a estrutura legal que os sustentava. Então decidi incorporar as informações do LEI da única fonte pública realmente confiável: https://www.gleif.org/en .


Imagens que exibem os nós, relacionamentos e atributos do Grafo de Conhecimento.


O grafo de conhecimento foi construído com os seguintes tipos de nós e relacionamentos, para responder a perguntas específicas. A lista abaixo não é exaustiva, mas sim serve para dar uma ideia do escopo do projeto.


Nós

Patrimônio Líquido

Dívida com taxa flutuante

Futuros

Fundos

Ações Preferenciais

Dívida Colateralizada

TROCAS

Empresa controladora do fundo

Dívida Corporativa

Dívida lastreada em ativos

TROCAS

Mutuários do Fundo

Dívida garantida por hipoteca

Mandados

País

Entidade Jurídica

Dívida Municipal

Opções

Moeda

Referência ISIN da entidade legal LEI

Dívida conversível

Avançar

Região

Relações entre Entidades Jurídicas

Relacionamentos

Tipo de ativo -> Participações do fundo

Tipo de ativo -> Entidade jurídica

Tipo de ativo -> Jurisdição legal

Série de Fundos -> Classes da Série de Fundos

Tipo de ativo -> País

Fundo -> Pessoa Jurídica

Tipo de ativo -> País da sede

Fundo -> Fluxos de Fundos

Tipo de ativo -> Moeda

Empresa controladora do fundo -> Entidade jurídica

Tipo de ativo -> País de localização

Fundo -> Desempenho do Fundo

País -> Região

Fundo -> Subfundos

Tipo de ativo -> Membro do índice

Patrimônio Líquido -> Perfil da Empresa

Existem outros tipos de relacionamento que resolvem questões de entidades jurídicas "muitos para muitos" que também são definidas explicitamente.


O objetivo inicial do caso de uso para a combinação desses dados era:

  • medição de risco de exposições cambiais

  • posicionar o risco para instituições e mercados

  • Rastreamento de entidades legais para empresas multinacionais

  • Qual é a cadeia de impacto para aquisições de ativos?


Para demonstrar parte disso, comecei expandindo um fundo no Neo4J Bloom. O fundo possui empréstimos e swaptions como ativos:



ree
ree

Em seguida, a Entidade Jurídica (EJ) do ativo SWAP subjacente, abrangido pela SWAPção, era uma Contraparte do SWAP, rastreada até uma empresa chamada Citigroup Global Markets:


ree

Que por sua vez estava sob outra subsidiária da Citigroup LE, chamada Citigroup Financial Products:


ree


Em seguida, a empresa Citigroup acima foi expandida, revelando-se como a Entidade Jurídica e Contraparte Não Compensada Centralmente (NCC) para diversos contratos de recompra, e a Entidade Jurídica para Dívida de Taxa Flutuante:


ree

Analisando os acordos de recompra com mais detalhes, vemos que eles acabam por estar vinculados ao detentor do ativo, que neste caso específico são dois fundos mútuos — os objetos verde-claros com ícones de banco. Também podemos observar a moeda do acordo de recompra/moeda de garantia, que é o Euro.


Isso significa que a empresa ligada ao Citigroup tem exposição ao euro e pode ser impactada por grandes variações nas taxas de câmbio desses ativos. A situação é semelhante com os dois fundos mútuos em relação à exposição ao euro. Muitos fundos mútuos e ETFs compensam seus riscos cambiais comprando contratos a termo de câmbio. Se eu tivesse expandido a análise dos fundos neste caso e eles estivessem sediados nos Estados Unidos, provavelmente veríamos esses contratos a termo como ativos detidos pelos fundos.


ree

Seguindo outro caminho a partir da Entidade Jurídica dos Produtos Financeiros do Citigroup, chegamos a outras empresas que operam em outros países, dentro de outra holding. O primeiro círculo laranja representa uma gestora de fundos com vários outros fundos a ela associados (quatro círculos laranja à direita).


ree

Finalmente, rastreamos a Citigroup Financial Products LE, responsável pelos ativos e fundos mencionados acima, até a Citigroup Inc. LE, que está no topo da hierarquia.


ree

Como você pode ver, a capacidade de mapear Identificadores de Entidades Legais (LEI) entre diferentes organizações e suas estruturas subjacentes pode ter um impacto significativo em nossa capacidade de navegar, avaliar, rastrear e compreender riscos que não são facilmente detectados. Comecei com isso como a base fundamental para construir meu aplicativo de IA, já que oferece recursos poderosos para quantificar impactos em organizações e sistemas financeiros. A seguir, vou me aprofundar na arquitetura do aplicativo e ampliar seu escopo para refletir mais recursos que eu buscava.

bottom of page