1. 需求

某公司希望对自己公司的开放数据进行分类,过滤掉不完善的信息!信息的内容如下格式大概有1000万条1.27G

为了隐私安全做了图片马赛克下面是数据样式(主要学技术)

需求 - 图1