Dataround非结构化数据同步
最近需要对非结构化数据同步,找了好久终于发现开源Dataround支持非结构化数据同步,最重要的界面化操作,不需要写配置,非常契合我的需求。
Dataround支持S3、HDFS、FTP、SFTP、本地文件的非结构化同步

- Dataround非结构化文件同步支持文件名正则过滤
- Dataround支持子目录一起同步
- 支持定时同步
看了文档实现原因是基因rawdata的二进制文件同步,不用解析,速度非常快。后续分享Dataround结构化、CDC数据同步。https://dataround.io
