ETF、共同基金和股东数据:检索内容
- Claude Paugh
- 4月17日
- 讀畢需時 2 分鐘
已更新:8月18日
正如我在上一篇文章中提到的,
如果您是软件开发人员,那么您有很多选择
我使用 JetBrains DataGrid(我购买了许可证),他们提供了自己的驱动程序:


正如您在上面的结果集中看到的,“列”代表来自底层 JSON 文档的键,值对应于网格中的数据。使用 DataGrid 或 Couchbase UI 查询时引用是相同的。
列是键,如果它们嵌套在文档中,则路径将位于 JSON 结构内,例如:
SQL++赚钱示例
select distinct gi.regFileNumber as SECFileNumber,
gi.regStateConditional.regState as State,
gi.regStateConditional.regCountry as County,
gi.IsFinalFiling as IsFinalFiling,
gi.seriesName as SeriesName,
gi.seriesLei as SeriesLEI,
gi.seriesId as SeriesId,
gi.regName as FundCompany,
gi.PeriodEndDate as PeriodEndDate,
gi.ReportAuthorizedDate as ReportAuthorizedDate,
gi.ParentLEI as ParentLEI,
gi.regCik as CIK,
gi.regCity as City,
gi.regLei as LEI,
gi.regPhone as Phone,
gi.regZipOrPostalCode as PostCode,
round(tonumber(fp.cshNotRptdInCorD), 2) as CashNotReported,
round(tonumber(fp.assetsInvested), 2) as AssetsInvested,
round(tonumber(fp.assetsAttrMiscSec), 2) as Assets_Attributed_MiscSecurities,
round(tonumber(fp.totAssets), 2) as TotalAssets,
round(tonumber(fp.totLiabs), 2) as TotalLiabilities,
round(tonumber(fp.netAssets), 2) as NetAssets
FROM `us-fund-filings`.`Funds`.GeneralInformation gi JOIN `us-fund-filings`.`AssetManagers`.FundParents fp ON (fp.CIK = gi.regCik and gi.PeriodEndDate = fp.PeriodEndDate) WHERE gi.PeriodEndDate = '2023-02-28;'
创建索引
如果存储的文档数量很大,则需要创建索引。由于我拥有超过五年的投资组合文件,因此我创建了多个。由于 Couchbase 没有用户控制的分区,我使用 WHERE 子句创建了索引来控制日期范围。 Couchbase 查询优化器尝试对数据进行分区。然而,这发生在运行时,并且索引在实现分区概念方面更有效率。
CREATE INDEX `adv_issuerCat_PeriodEndDate_assetCat2024` ON `us-fund-filings`.`Portfolios`.`Investments`(`PeriodEndDate`,`assetCat`) WHERE ("2024-01-01" <= `PeriodEndDate`);
CREATE INDEX `adv_PeriodEndDate_derivativeInfo_optionSwaptionWarrantDeriv_derivCat_2024_1` ON `us-fund-filings`.`Portfolios`.`Investments`(`PeriodEndDate`,((`derivativeInfo`.`optionSwaptionWarrantDeriv`).`derivCat`)) WHERE (("2024-01-01" <= `PeriodEndDate`) and (`PeriodEndDate` <= "2024-03-31"));您为什么决定存储这些数据?
我认为结合这些数据可能对以下几种用例有用:
资产管理公司之间或单个资产管理公司内部的趋势
通过分析每个季度态度模式的变化并将其与当前事件关联起来,您可以发现可能有益的习惯或模式。
演示准确性:我想看看演示与资产管理人的季度投资者报告的匹配程度。答案是肯定的,但如果不是,为什么?
货币风险随时间的变化以及哪些资产管理公司面临的风险最大或最小
美国资产管理基金所有部门内部或跨部门的每月现金流。可以对不同类型的资产进行分析以识别共同特征。
这是一个开始,但还有其他可以实施的分析和研究用例。我还考虑在分析中添加一个新的方面;将数据加载到图形数据库有什么好处?


