网络在线手游棋牌 棋牌热点 计算机系的你,毕业论文写了什么

计算机系的你,毕业论文写了什么

本科操作系统
研究生编译器

本科毕设是激光SLAM, 都是很老的算法. 用四叉树建图, ICP帧间匹配, 粒子滤波自定位, 用随机抽样做回环检测. 然后Astar规划路径, 配合地图分割来加速(实际上速度更慢了…..). 展示是QT结合openCV写的. 最后在PeopleBot(激光雷达被人拆走了)上面用电工胶布粘了一个Hokuyo UST10LX当雷达跑的图. 代码全程手写. 得亏用了Python, 要不然这得肝到猴年马月去……

另外交代码的时候还要交文档, 多亏平时注释习惯好, 用Doxygen直接生成LaTeX, 改吧改吧就交上去了.

不说我自己的了,中规中矩没啥意思。一个同学的,报的题目是计算机图形学的啥应用。

答辩的时候,大家对着PPT讲各种系统结构图,各种高大上的算法。唯有这货就拿着张纸上去了,好在是彩打,站在讲台上向下面晃了下,说,这就是我针对今年的XX运动会(实在是忘了)设计的LOGO。这个圈代表XXX,这个叉代表XXXX……

Are you kidding me? 同学,你选错专业了吧?

计算机系的你,毕业论文写了什么插图本科毕业时候的原题是,基于WEB数据的领域本体构建方法与应用,最后就是做成了基于本体的智能爬虫。(对,重点倒置了)

之前完全没接触过本体,12月给的题,考完研,在家休息(其实是干活)了一个月,2月份失恋之后开始看综述,看论文。
感受就是非常痛苦,每天就处于,我是谁,我在哪儿,我在看啥,这是啥,这又是啥,的懵逼状态。
后来经师兄提点,要用到WEB数据的话,爬虫吧。

实验室里的师兄@Snake 是本体王,从大二开始研究本体,所以我经常,带着纸和笔,惨兮兮的坐在他桌子旁,求大师兄给点思路_(:з」∠)_

大师兄的确给了我很多引导,分享了很多资料,讯息,也给我理顺了思路,这点非常感谢他。

他推荐了一个爬虫软件给我,叫八爪鱼,我学会使用之后,觉得体现不出我的工作量,而且如果要结合本体爬虫的话,肯定要改,所以还是决定自己写。

因为@敖天羽 去上班了,老师希望我能接她在实验室的工作,于是我的课题越发往她做的方向靠近。小天做了一个电商平台比价系统,我的爬虫也就往电商平台靠近了。她告诉我她的爬虫用的Selenium,实验室另一个师兄知道后给了我一本《Selenium2自动化测试实战》,从python基本语法开始,到Selenium库的用法,我看完前面几章就脱手自己写了
后来实战的时候还是遇到了一些问题,那段时间认识了网友@Itoktsnhc恰好是做爬虫相关的工作,也给了我许多引导,非常感谢w

我做系统的能力很差,代码写得少,老师曾建议让我把爬虫布在小天做的系统上,我觉得非常不好意思,就没这么做_(:з」∠)_

在定了大致方向之后,我设想让爬虫能从网上找到领域商品的相关评测。
那到底怎么结合本体呢?初步设想是运用TF-IDF文本相似度。

接着我开始思考如何构建领域本体。要构建领域本体,那么我需要领域词汇。我曾漫无目的在京东上瞎爬了一段时间,后来大师兄点醒我,电商平台的分类目录其实就是潜在的领域词汇库。

再后来,我毕业设计流程分成了三大块,先从电商平台爬取商品目录获取领域词汇,然后构建领域本体,再根据构建的本体赋予不同层级词汇权重,让爬虫根据这个权重去给网站上爬到的文章打分,找到和领域相关性大的文章。
(目标越做越飘)

踩坑途中随手糊了一篇博客http://www.nutllwhy.com/?p=188

因为实验室还有两个用神经网络做翻译系统的牛人,本身也对自己的课题能做到什么水平不太确定,所以没报优秀毕业设计,划水过了。

感觉收获还是很大的,一路探索,一路挖掘,也越发对自己的优势劣势有了全面的认识,逐渐知道了自己研究生阶段该朝什么方向查漏补缺。
反正呢,用心去做的东西,一定会给你回报。

如 @栗噔噔 所言 爬虫+比价系统一只,刚开始还考虑反爬之类的,结果发现 Selenium 忒 TM 慢了,只要稳定不挂,基本和反爬绝缘,保证一下稳定性和挂了可恢复,最终保证数据唯一性就够了。

还是智能爬虫牛逼,当时老师给我糊了一个 all in 数据融合,自动生成 wiki 知识库的大计,然后我抓耳挠腮觉得不太可能,毕竟百度之前建立知识库全靠人工。加上智能爬虫自动找领域内容爬领域知识,还指着个论坛告诉我论坛里也有可能有相关价格,得把她抽取出来,我苦思冥想而不得,最终糊了个基础爬虫一只。

想到这里,还是 @栗噔噔 牛逼,完成了我未尽的事业,未完成的遗愿。

本文来自网络,不代表网络在线手游棋牌立场,转载请注明出处:https://mip.qidake.com/17285/

作者: qipai

上一篇
下一篇

发表评论


返回顶部