欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页  >  后端开发

请问IT桔子的数据从哪儿获取?

程序员文章站 2022-04-20 14:23:47
...
IT桔子是关注IT互联网行业的结构化的公司数据库和商业信息服务提供商。请问网站IT桔子(IT桔子官方网站
的数据:创业者,机构,投资人,新闻等数据是怎么样获取的?
相同的问题是,36氪的哪些创业公司数据从哪儿获取?
这些都是完全由爬虫抓取的吗?还是有直接的数据渠道?
如果有爬虫抓取,那么这种爬虫的实现有什么具体的参考和路径?

回复内容:

itjuzi.com 的数据来源比较多,总结起来主要有以下方式:

一类是技术抓取,包括主要新闻媒体、应用商店等,目前大概30%比例

一类是用户UGC贡献,目前大概30%比例

一类是合作伙伴数据渠道,比如和一些招聘网站、开发者社区建立联系,定期获取;还包括来自于投资机构的数据,尤其是在投资事件的信息获取上,大概占比也有30%

另外10%则来自于 IT桔子的成员作为互联网创业和投资爱好者,主动去发现及个人人脉积累了~~ 支持IT橘子,希望加重用户UGC功能,简化审核权限