ris 发表于 2021-6-16 18:21:52

轻松合理的获取数据 | 基于标记语言的开源爬虫框架(Trico cloud 云原生)

写在前面名词解释[*]Trico 框架名。[*]Trico script 官方脚本代码。[*]Salyut 脚本虚拟机 负责语法解析,表达式解析。[*]Trico cloud Trico 生态,将脚本调度和虚拟机在云端部署。Trico 的诞生
Trico起初是为了满足公司大量的数据提取需求(当然是公开可获取的:)),最早我们是使用 Java+Jsoup+selenium 来完成的。但是随着维护的网站数量越来越多,网站的改版等等异常将会产生大量的工作量,于是我们就想能不能有个轻量级的脚本,既可以热更新(快速的解决 Bug )又可以提供一些带有复合功能的元语 来提高开发效率。于是 Trico 就诞生了。
如何使用 Trico
Trico 是一个基于标记语言的脚本语言,词法相对都比较简单,学习曲线相对降低,一般的程序员 1 ~ 2 天即可以完全上手。当然我们也希望对于不是程序员背景也能使用 Trico,把他当作一个数据的提供者或者了解编程概念的语言。
[*]Salyut 语法[*]快速开始
看到这里想必你对 Trico 或多或少有一些兴趣,我们也开源了 Salyut 引擎,方便的话请给我们个 Star,给我们个鼓励。
页: [1]
查看完整版本: 轻松合理的获取数据 | 基于标记语言的开源爬虫框架(Trico cloud 云原生)