第203页
“点击量是一个考核,还有点赞转发数,另外还需要根据读者评论对内容质量进行评估,觉得文章切实有用的是什么比例,觉得文章是育儿行外人随便写的不值得参考的是什么比例。总而言之就是需要对抓取的数据根据一定的标准进行进一步筛选,再产出。删掉争议性的,留下最佳内容。”
陈平戈的脑袋转得飞快,找回了当年跟程序员提需求虐待技术开发部的感觉:
“这样吧,我来帮忙,把你的笔记本电脑借我,我来做个内容考核权重,你写程序的时候,直接根据我制定的规则,进行赋值就可以了。”
她说了一大堆,都是一些比较粗浅的东西,也不知道能不能帮到谌颐。
谌颐无限配合,“我们来试试。”
于是他们两个来到了谌颐的书房,把孩子放在一旁睡觉,开始干活。
陈平戈很久没有摸电脑里,打开excel表的时候,还有点不知道怎么用了。
摸着键盘,她有点怀念工作的感觉了。
陈平戈做完她那一部分的,就到谌颐身边看他写程序。
利用爬虫抓取数据听起来容易,操作起来却不一定容易。
浅层的数据抓取很容易,但稍微专业度高点的,或者稍微大点的公司的数据,是保护得很好的,要巧妙绕过很多隐私框架协议,才能获取,她对谌颐短时间写出来的程序,还是很好奇的。
不过很大程度是她想多了,他们要的内容,只是解答简单的一周岁左右的孩子的育儿问题而已。
她只是想要一个比普通搜索器更便捷好用的、能自动搜索、自动整合最佳答案的搜索器。
还能跟你对话的。
谌颐很快写好了程序,给了程序一段时间跑数据,跑完数据后,孩子还没睡醒。