现如今,“在线搜题”在中小学生当中已经不是稀奇事。“小猿搜题”和“作业帮”们作为最经典的在线学习工具之一,为中小学生们带来了极大的便利。
但与此同时,大学生们迟迟没能享受到“拍照搜题”的服务,市面上始终没能出现一款属于大学生的搜题软件,“在线搜题”在大学生用户这头出现了一片空白。
那么,适合大学生使用的搜题软件是什么样的?制作一款这样的软件需要解决什么问题?要用到什么技术?这样一款产品,在市面上会有市场吗?
一、大学生需要怎样的搜题软件?
要做一款大学生搜题软件,首先要明确一下,大学生需要的搜题软件是什么样的?
市面上传统的搜题软件,大家都很熟悉了,基本上以面向中小学生的内容为主。以其中比较具有代表性的产品小猿搜题,场景需求基本上保持相似的逻辑。它们高频使用场景都是“拍照搜题”,然后用题库中的数据满足搜题的内容需求。
由于中小学生的练习题使用的知识点重合度非常高,题目答案都趋向标准化,这种搜题模式基本能够满足中小学生和家长的搜题需求。小猿搜题、作业帮等产品也有了不断发展成熟的土壤。
和传统搜题软件面向的中小学生不同,大学生学习内容大大增加,内容从深度到广度都有了极高的提升。
大学生的课程被大致分为通识课和专业课:通识课即英语课、思修课等,所有大学生都需要修读,普适性强,也相对标准化;而专业课内容则有很强的专业性,题目发散性往往非常强,需要的知识也更多,更具针对性。因此,大学生对搜题软件的内容需求比中小学生复杂得多。
根据大学课程知识体系的特点,大学生搜题需要的内容主要分为下面两种:
大学生的搜题需求也因此具备以下特点:
做一款大学生的搜题软件,需要具备的核心内容就需要满足这些需求特点。那么,满足这些需求的软件是什么样的?需要具备什么样的技术?
二、怎么满足大学生的搜题需求?
前面分析了大学生对搜题软件的个性化需求,假设真的要制作一个面向大学生的搜题产品,它需要解决两个方面的问题:
1.完善搜题流程
整体来看,大学生搜题软件的搜题逻辑与市面上已有的搜题软件大致相同,可以用文字输入或图片上传的方法进行搜题。天天问小伙伴@影.参考市面上现有的搜题软件,给出了一个可供参考的流程:
①上传图片。
②预处理图片:即对图像的模糊、旋转、颜色反转等问题进行处理。
③切分:对图片中的汉字、英文、符合加以区别。
经过“二值化”之后整个图像会呈现出明显的黑白效果,这样一来,图像就变得简单了,而且数据量也减小了,还能凸显出感兴趣的目标的轮廓。接着自然也就可以把单个字符切分出来了。
④识别:把字符切分出来之后,软件还是“认不出”这个字符是什么的,所以接下来还要“识别”这些字符。这时就需要光学字符识别技术(OCR)和深度学习(DeepLearning)技术上场了。
在“识别”这个过程中,PhotoMath主要使用了OCR技术,而小猿搜题则主要使用了DeepLearning技术。DeepLearning是机器学习其中的一个分支,其动机在于建立、模拟人脑进行分析学习的神经网络,模仿人脑的机制来解释数据,例如图像,声音和文本。
⑤纠错:利用语言模型进行纠错。
不论是OCR技术还是深度学习技术都不能保证100%识别正确,所以中间可能还需要插入一个纠错过程,像“1和l”、“好图所示和如图所示”、“入和人”这些形式非常相近的字符机器也很容易读错。通过DeepLearning、标注数据、优化算法等对图中文字进一步识别。理工科的大学内容中常常包含难以识别的专业符号,这些东西也可以依赖OCR技术解决。
⑥搜索:经过上述这些步骤,将题目转化成文字,然后在题库中进行搜索,最终返回题目答案以及解析。
另外,这个过程中还使用了以图搜图的技术加以补充。以图搜图的方法就是把用户拍摄的图片和已有的图片题库做匹配。这和我们平常通过上传图片的方式在搜索引擎中找与之相似的图片其实非常类似,只是在图片匹配的过程中有“计算机视觉+机器学习”和“深度学习”这两种方式可选。
2.建立面向大学生的题库
作为一个搜题软件,题库内容是其给用户提供服务的过程中非常重要的一部分——用户产生解题需求后,需要在题库内搜索解题方案,系统通过与数据库匹配为用户提供最贴合的解决方案。
上文对大学生搜题需求的分析中,我们已经将大学生所需的题目内容进行了简单的分析,我们需要一个怎样的题库?
信息量大,知识面广,专业水平高,逻辑框架要与当前国内高等教育各专业教学体系框架高度统一,题库更新的频率要足够快。
接下来就要可以通过下面的方法搭建一个题库,能分别满足这些内容需求。
①标准化内容
标准化内容中,一部分普适性非常强。例如四六级、国考,大学生课本内容等,网络上的题目信息并不难找,甚至市面上已经有人整理过相应的题库,可以直接购买使用这一类内容。
而另一部分,针对专业水平要求更高的内容,天天问一位小伙伴提出一个建议:用户来自校园,解决方案也可以来自校园。
可以考虑与有能力的综合类大学进行校企合作。通过支付一定的报酬,获取大学内各个学科的教学框架,知识内容等,同时也可以在高校内招募答题人。
此外,还可以以学科为单位与高校进行合作,根据鼓励用户根据相应的学科或课程分类上传题库,维持题库中内容的扩充。
借此,企业能够弥补专业水平上的短板,丰富内容生态。
②非标准化内容
同时,针对发散性较强的问题,大学生往往更需要资料与信息的参考,而非直接给出的答案。因此平台也可以鼓励用户上传课件等内容,收录进题库的数据中。
三、大学生搜题软件值得做吗?
因此,天天问的问答页面下,小伙伴们对大学生搜题软件的态度大多并不乐观。
主要原因有两个:
正是因为这些难题,至今市面上仍然没能产出一个相对成熟的大学生搜题产品,由于其投入大,变现产出又显然比较慢,一款试图作用于大学生所有搜题需求的搜题软件发展前景并不好。
但问答讨论中,天天问小伙伴还给出了一些方向,可以在大学生搜题的领域进行探索:
1.针对覆盖面广的标准化知识形成题库
前面提到过,大学通识课内容中有相当大一部分高度标准化的知识,还有语言考试、教资、国考等考试内容也高度标准化,已有的大学生搜题APP如学小易,就专门列出了大学生常用课本的习题答案。
还可以针对其中某一个领域发力,形成该领域的题库。专业化内容多了,或者形成该领域的内容生态,就可以推出知识付费来变现。
市面上已经有不少具有类似搜题功能的产品,往往是相应领域的知识类APP,利用其资源库做出了类似题库、学习平台的功能,可供参考的案例不少。比如针对英语四六级考试的平台粉笔四六级,它的刷题页面就带有“对答案”等搜题功能。
2.以小程序为载体试运营
针对一些个性化但有固定标准答案的内容,比如大学自行开设的网课,也有学生自发组织上传的题库与答案,只需要简单的小程序甚至自动回复功能就能满足需要,不失为一个尝试的好方法。
总结下来,大学生搜题软件整体来看可能吃力不讨好,但细分下还有许多值得做的内容。