昨天总结了深度学习的资料,今天把机器学习的资料也总结一下(友情提示:有些网站需要"科学上网"^_^)
推荐几本好书:
1.PatternRecognitionandMachineLearning(byHastie,Tibshirani,andFriedman's)
2.ElementsofStatisticalLearning(byBishop's)
这两本是英文的,但是非常全,第一本需要有一定的数学基础,第可以先看第二本。如果看英文觉得吃力,推荐看一下下面几本英文书。
3.机器学习实战
4.集体智慧编程
5.统计学习方法
6.机器学习
Ps:我个人的学习方法就是看书,因为我觉得看书比较快,视频太慢了,有些不懂的地方会找一些MOOC视频来理解,这样效率比较高。入门的话看以上推荐的几本书还是很好入门的,中英文均可,把一本书吃透比所有都看过但所有都不记得要好。
以下是搜集的其他资料,我看过的会有一些小说明:
Summary:
Onlinecourses:
很多人接触的第一个关于机器学习的视频大概就是AndrewNg的课,入门课,讲的清晰易懂,涉及数学的方面也没有讲的很深奥,基本上都能听懂。如果数学基础差,也可以在网上搜一下这个课程的学习笔记,很多人总结的还是很好的,也很详细。唯一的不好就是这么课的编程语言是Octave,呃,相当于开源版的Matlab,但是在工作中用的不多(其实基本上不用。。),Python用的会比较多一点,所以可以看这个课程了解算法背后的原理,再用其他的编程语言(如Python,java等)来实现。
除了介绍机器学习算法以外,还介绍了推荐系统和深度学习,这两个概念现在很火,值得一看。此外,讲的非常有趣,用的是Python,而且是真实数据集,看完可以直接上手工业界的项目了~
深入讲算法背后的统计和数学知识,相对于前两个课程,可能没那么有趣,毕竟数学==,而且在讲R的实操的时候会很啰嗦,有一些测试时错的,不太建议入门看这个,想补数学知识可以直接看上文说到的李航老师的《统计学习方法》。
其他:
4.MiningMassiveDatasets
5.RecommenderSystems
Books:
Applicationsandadvancedtopics:
介绍:这是一本由雪城大学新编的第二版《数据科学入门》教材:偏实用型,浅显易懂,适合想学习R语言的同学选读。
介绍:这并不是一篇文档或书籍。这是篇向图灵奖得主DonaldKnuth提问记录稿:近日,CharlesLeiserson,AlAho,JonBentley等大神向Knuth提出了20个问题,内容包括TAOCP,P/NP问题,图灵机,逻辑,以及为什么大神不用电邮等等。
介绍:对深度学习和representationlearning最新进展有兴趣的同学可以了解一下
介绍:DenizYuret用10张漂亮的图来解释机器学习重要概念:1.Bias/VarianceTradeoff2.Overfitting3.Bayesian/Occam'srazor4.Featurecombination5.Irrelevantfeature6.Basisfunction7.Discriminative/Generative8.Lossfunction9.Leastsquares10.Sparsity.很清晰
介绍:这是一本书籍,主要介绍的是跨语言信息检索方面的知识。理论很多
介绍:康奈尔大学信息科学系助理教授DavidMimno写的《对机器学习初学者的一点建议》,写的挺实际,强调实践与理论结合,最后还引用了冯诺依曼的名言:"Youngman,inmathematicsyoudon'tunderstandthings.Youjustgetusedtothem."
介绍:这是一本关于分布式并行处理的数据《ExplorationsinParallelDistributedProcessing:AHandbookofModels,Programs,andExercises》,作者是斯坦福的JamesL.McClelland。着重介绍了各种神级网络算法的分布式实现,做DistributedDeepLearning的童鞋可以参考下
介绍:2014年国际机器学习大会(ICML)已经于6月21-26日在国家会议中心隆重举办。本次大会由微软亚洲研究院和清华大学联手主办,是这个有着30多年历史并享誉世界的机器学习领域的盛会首次来到中国,已成功吸引海内外1200多位学者的报名参与。干货很多,值得深入学习下
介绍:100BestGitHub:DeepLearning
介绍:这份文档来自微软研究院,精髓很多。如果需要完全理解,需要一定的机器学习基础。不过有些地方会让人眼前一亮,毛塞顿开。
介绍:ACL候任主席、斯坦福大学计算机系ChrisManning教授的《自然语言处理》课程所有视频已经可以在斯坦福公开课网站上观看了(如Chrome不行,可用IE观看)作业与测验也可以下载。
介绍:对比DeepLearning和ShallowLearning的好文,来着浙大毕业、MIT读博的ChiyuanZhang的博客。
介绍:利用卷积神经网络做音乐推荐。
介绍:机器学习的算法很多。很多时候困惑人们都是,很多算法是一类算法,而有些算法又是从其他算法中延伸出来的。这里,我们从两个方面来给大家介绍,第一个方面是学习的方式,第二个方面是算法的类似性。
介绍:看题目你已经知道了是什么内容,没错。里面有很多经典的机器学习论文值得仔细与反复的阅读。
介绍:视频由加州理工学院(Caltech)出品。需要英语底子。
介绍:总结了机器学习的经典书籍,包括数学基础和算法理论的书籍,可做为入门参考书单。
介绍:16本机器学习的电子书,可以下载下来在pad,手机上面任意时刻去阅读。不多我建议你看完一本再下载一本。
介绍:标题很大,从新手到专家。不过看完上面所有资料。肯定是专家了
介绍:入门的书真的很多,而且我已经帮你找齐了。
介绍:Sibyl是一个监督式机器学习系统,用来解决预测方面的问题,比如YouTube的视频推荐。
介绍:关于(Deep)NeuralNetworks在NLP和TextMining方面一些paper的总结
介绍:计算机视觉入门之前景目标检测1(总结)
介绍:计算机视觉入门之行人检测
介绍:Importantresourcesforlearningandunderstanding.Isawesome
介绍:在线NeuralNetworksandDeepLearning电子书
介绍:python的17个关于机器学习的工具
介绍:把机器学习提升的级别分为0~4级,每级需要学习的教材和掌握的知识。这样,给机器学习者提供一个上进的路线图,以免走弯路。另外,整个网站都是关于机器学习的,资源很丰富。
介绍:机器学习各个方向综述的网站
介绍:深度学习阅资源列表
介绍:这是一本来自微的研究员liPeng和DongYu所著的关于深度学习的方法和应用的电子书
介绍:2014年七月CMU举办的机器学习夏季课刚刚结束有近50小时的视频、十多个PDF版幻灯片,覆盖深度学习,贝叶斯,分布式机器学习,伸缩性等热点话题。所有13名讲师都是牛人:包括大牛TomMitchell(他的[机器学习]是名校的常用教材),还有CMU李沐.(1080P高清哟)
介绍:谷歌研究院的ChristianSzegedy在谷歌研究院的博客上简要地介绍了他们今年参加ImageNet取得好成绩的GoogLeNet系统.是关于图像处理的。
介绍:网友问伯克利机器学习大牛、美国双料院士MichaelI.Jordan:"如果你有10亿美金,你怎么花?Jordan:"我会用这10亿美金建造一个NASA级别的自然语言处理研究项目。"
介绍:Videolectures上最受欢迎的25个文本与数据挖掘视频汇总
介绍:对话机器学习大神MichaelJordan
介绍:是Stanford教授AndrewNg的DeepLearning教程,国内的机器学习爱好者很热心的把这个教程翻译成了中文。如果你英语不好,可以看看这个
介绍:这是多伦多大学做的一个深度学习用来识别图片标签/图转文字的demo。是一个实际应用案例。有源码
介绍:机器学习模型,阅读这个内容需要有一定的基础。
介绍:机器学习无疑是当前数据分析领域的一个热点内容。很多人在平时的工作中都或多或少会用到机器学习的算法。本文为您总结一下常见的机器学习算法,以供您在工作和学习中参考.
介绍:LinkedIn开源的机器学习工具包,支持单机,Hadoopcluster,和Sparkcluster重点是logisticregression算法
介绍:对于英语不好,但又很想学习机器学习的朋友。是一个大的福利。机器学习周刊目前主要提供中文版,还是面向广大国内爱好者,内容涉及机器学习、数据挖掘、并行系统、图像识别、人工智能、机器人等等。谢谢作者
介绍:大数据数据处理资源、工具不完备列表,从框架、分布式编程、分布式文件系统、键值数据模型、图数据模型、数据可视化、列存储、机器学习等。很赞的资源汇总。
介绍:雅虎邀请了一名来自本古里安大学的访问学者,制作了一套关于机器学习的系列视频课程。本课程共分为7期,详细讲解了有关SVM,boosting,nearestneighbors,decisiontrees等常规机器学习算法的理论基础知识。
介绍:Wired杂志报道了UCLA数学博士ChrisMcKinlay(图1)通过大数据手段+机器学习方法破解婚恋网站配对算法找到真爱的故事,通过Python脚本控制着12个账号,下载了婚恋网站2万女用户的600万问题答案,对他们进行了统计抽样及聚类分析(图2,3),最后终于收获了真爱。科技改变命运!
介绍:MIT的UnderactuatedRobotics于2014年10月1日开课,该课属于MIT研究生级别的课程,对机器人和非线性动力系统感兴趣的朋友不妨可以挑战一下这门课程!
介绍:Google用DeepLearning做的antispam(反垃圾邮件)
介绍:机器学习速查表
介绍:从1996年开始在计算机科学的论文中被引用次数最多的论文
介绍:把今年的一个ACMTrans.onGraphics(TOG)论文中的代码整理为一个开源的算法框架,共享出来了。欢迎大家使用。可以实时的采集3D数据、重建出三维模型。Onlinelearning,GPURandomforest,GPUCRF也会后续公开。
介绍:不仅是资料,而且还对有些资料做了注释。
介绍:深度学习入门的初级读本
介绍:机器学习教会了我们什么?
介绍:scikit-learn是在SciPy基础上构建的用于机器学习的Python模块。
介绍:乔丹教授(MichaelI.Jordan)教授是机器学习领域神经网络的大牛,他对深度学习、神经网络有着很浓厚的兴趣。因此,很多提问的问题中包含了机器学习领域的各类模型,乔丹教授对此一一做了解释和展望。
介绍:本项目利用了MicrosoftAzure,可以在几分种内完成NLPonAzureWebsite的部署,立即开始对FNLP各种特性的试用,或者以RESTAPI的形式调用FNLP的语言分析功能
介绍:现任复旦大学首席教授、计算机软件博士生导师。计算机科学研究所副所长.内部课程
介绍:好东西的干货真的很多
介绍:作者是深度学习一线大牛Bengio组写的教程,算法深入显出,还有实现代码,一步步展开。
介绍:该课程是网易公开课的收费课程,不贵,超级便宜。主要适合于对利用R语言进行机器学习,数据挖掘感兴趣的人。
介绍:里面基本没涉及到具体算法,但作者介绍了CF在LinkedIn的很多应用,以及他们在做推荐过程中获得的一些经验。最后一条经验是应该监控log数据的质量,因为推荐的质量很依赖数据的质量!
介绍:初学者如何查阅自然语言处理(NLP)领域学术资料
介绍:用树莓派和相机模块进行人脸识别
介绍:如何利用深度学习与大数据构建对话系统
介绍:FrancisBach合作的有关稀疏建模的新综述(书):SparseModelingforImageandVisionProcessing,内容涉及Sparsity,DictionaryLearning,PCA,MatrixFactorization等理论,以及在图像和视觉上的应用,而且第一部分关于Whydoesthel1-norminducesparsity的解释也很不错。
介绍:RKHS是机器学习中重要的概念,其在largemargin分类器上的应用也是广为熟知的。如果没有较好的数学基础,直接理解RKHS可能会不易。本文从基本运算空间讲到Banach和Hilbert空间,深入浅出,一共才12页。
介绍:许多同学对于机器学习及深度学习的困惑在于,数学方面已经大致理解了,但是动起手来却不知道如何下手写代码。斯坦福深度学习博士AndrejKarpathy写了一篇实战版本的深度学习及机器学习教程,手把手教你用Javascript写神经网络和SVM.
介绍:【语料库】语料库资源汇总
介绍:本文会过一遍最流行的机器学习算法,大致了解哪些方法可用,很有帮助。
介绍:NYU2014年的深度学习课程资料,有视频
介绍:计算机视觉数据集不完全汇总
介绍:机器学习开源软件
介绍:ALibraryforSupportVectorMachines
介绍:github上面100个非常棒的项目
介绍:CIKMCup(或者称为CIKMCompetition)是ACMCIKM举办的国际数据挖掘竞赛的名称。
介绍:杰弗里·埃弗里斯特·辛顿FRS是一位英国出生的计算机学家和心理学家,以其在神经网络方面的贡献闻名。辛顿是反向传播算法和对比散度算法的发明人之一,也是深度学习的积极推动者.
介绍:微软研究院深度学习技术中心在CIKM2014上关于《自然语言处理的深度学习理论与实际》教学讲座的幻灯片
介绍:徐宗本院士将于热爱机器学习的小伙伴一起探讨有关于机器学习的几个理论性问题,并给出一些有意义的结论。最后通过一些实例来说明这些理论问题的物理意义和实际应用价值。
介绍:作者还著有《这就是搜索引擎:核心技术详解》一书,主要是介绍应用层的东西
介绍:机器学习课程
介绍:推荐系统经典论文文献
介绍:第十二届中国"机器学习及其应用"研讨会PPT
介绍:统计学习是关于计算机基于数据构建的概率统计模型并运用模型对数据进行预测和分析的一门科学,统计学习也成为统计机器学习。课程来自上海交通大学
介绍:机器学习的目标是对计算机编程,以便使用样本数据或以往的经验来解决给定的问题.
介绍:CIKM2014JeffDean、QiLu、GerhardWeikum的主题报告的幻灯片,AlexSmola、LimsoonWong、TongZhang、Chih-JenLin的IndustryTrack报告的幻灯片
介绍:加州伯克利大学博士AriaHaghighi写了一篇超赞的数值优化博文,从牛顿法讲到拟牛顿法,再讲到BFGS以及L-BFGS,图文并茂,还有伪代码。强烈推荐。
介绍:R语言程序员私人定制版
介绍:谷歌地图解密
介绍:空间数据挖掘常用方法
介绍:Kaggle新比赛”Whenbagofwordsmeetsbagsofpopcorn“aka”边学边用word2vec和deeplearning做NLP“里面全套教程教一步一步用python和gensim包的word2vec模型,并在实际比赛里面比调参数和清数据。如果已装过gensim不要忘升级
介绍:UTAustin教授EricPrice关于今年NIPS审稿实验的详细分析,他表示,根据这次实验的结果,如果今年NIPS重新审稿的话,会有一半的论文被拒。
介绍:2014中国大数据技术大会33位核心专家演讲PDF下载
介绍:ConvexNeuralNetworks解决维数灾难
介绍:深度学习阅读清单
介绍:LambdaNetLambdaNet是由Haskell实现的一个开源的人工神经网络库,它抽象了网络创建、训练并使用了高阶函数。该库还提供了一组预定义函数,用户可以采取多种方式组合这些函数来操作现实世界数据。
介绍:"人工智能研究分许多流派。其中之一以IBM为代表,认为只要有高性能计算就可得到智能,他们的‘深蓝’击败了世界象棋冠军;另一流派认为智能来自动物本能;还有个很强的流派认为只要找来专家,把他们的思维用逻辑一条条写下,放到计算机里就行……"杨强在TEDxNanjing谈智能的起源
介绍:网易有道的三位工程师写的word2vec的解析文档,从基本的词向量/统计语言模型->NNLM->Log-Linear/Log-Bilinear->层次化Log-Bilinear,到CBOW和Skip-gram模型,再到word2vec的各种tricks,公式推导与代码,基本上是网上关于word2vec资料的大合集,对word2vec感兴趣的朋友可以看看
介绍:机器学习日报里面推荐很多内容,在这里有一部分的优秀内容就是来自机器学习日报.
介绍:作者与Bengio的兄弟Samy09年合编《自动语音识别:核方法》3)李开复1989年《自动语音识别》专著,其博导、94年图灵奖得主RajReddy作序
介绍:作者是360电商技术组成员,这是一篇NLP在中文分词中的应用
介绍:Tropp把数学家用高深装逼的数学语言写的矩阵概率不等式用初等的方法写出来,是非常好的手册,领域内的paper各种证明都在用里面的结果。虽说是初等的,但还是非常的难
介绍:不容错过的免费大数据集,有些已经是耳熟能详,有些可能还是第一次听说,内容跨越文本、数据、多媒体等,让他们伴你开始数据科学之旅吧,具体包括:Data.gov、USCensusBureau、EuropeanUnionOpenDataPortal、Data.gov.uk等
介绍:谷歌科学家、Hinton亲传弟子IlyaSutskever的深度学习综述及实际建议
介绍:里面融合了很多的资源,例如竞赛,在线课程,demo,数据整合等。有分类
介绍:《机器学习的统计基础》在线版,该手册希望在理论与实践之间找到平衡点,各主要内容都伴有实际例子及数据,书中的例子程序都是用R语言编写的。
介绍:IVANVASILEV写的深度学习导引:从浅层感知机到深度网络。高可读
介绍:本文是对《机器学习实战》作者PeterHarrington做的一个访谈。包含了书中部分的疑问解答和一点个人学习建议
介绍:非常好的深度学习概述,对几种流行的深度学习模型都进行了介绍和讨论
介绍:主要是讲述了利用R语言进行数据挖掘
介绍:DeepLearning算法介绍,里面介绍了06年3篇让deeplearning崛起的论文
介绍:概率论:数理逻辑书籍
介绍:一个用来快速的统计,机器学习并且对于数据量大的数学库
介绍:在这里你可以看到最近深度学习有什么新动向。
介绍:信息几何学及其在机器学习中的应用
介绍:NeuralTalkisaPython+numpyprojectforlearningMultimodalRecurrentNeuralNetworksthatdescribeimageswithsentences.NeuralTalk是一个Python的从图像生成自然语言描述的工具。它实现了Google(Vinyals等,卷积神经网络CNN+长短期记忆LSTM)和斯坦福(KarpathyandFei-Fei,CNN+递归神经网络RNN)的算法。NeuralTalk自带了一个训练好的动物模型,你可以拿狮子大象的照片来试试看
介绍:用统计和因果方法做机器学习(视频报告)
介绍:一个讲机器学习的Youtube视频教程。160集。系统程度跟书可比拟。
介绍:美团推荐算法实践,从框架,应用,策略,查询等分析
介绍:深度学习用于问答系统答案句的选取
介绍:CNN用于WEB搜索,深度学习在文本计算中的应用
介绍:Awesome系列中的公开数据集
介绍:一个学术搜索引擎
介绍:用Python和Cython写的工业级自然语言处理库,号称是速度最快的NLP库,快的原因一是用Cython写的,二是用了个很巧妙的hash技术,加速系统的瓶颈,NLP中稀松特征的存取
介绍:Topicmodeling的经典论文,标注了关键点
介绍:多伦多大学与Google合作的新论文,深度学习也可以用来下围棋,据说能达到六段水平
介绍:18freeeBooksonMachineLearning
介绍:DEEPLEARNING.UNIVERSITY的论文库已经收录了963篇经过分类的深度学习论文了,很多经典论文都已经收录
介绍:很多公司都用机器学习来解决问题,提高用户体验。那么怎么可以让机器学习更实时和有效呢?SparkMLlib1.2里面的StreamingK-means,由斑马鱼脑神经研究的JeremyFreeman脑神经科学家编写,最初是为了实时处理他们每半小时1TB的研究数据,现在发布给大家用了。
介绍:AMiner是一个学术搜索引擎,从学术网络中挖掘深度知识、面向科技大数据的挖掘。收集近4000万作者信息、8000万论文信息、1亿多引用关系、链接近8百万知识点;支持专家搜索、机构排名、科研成果评价、会议排名。
介绍:机器学习公开课汇总,虽然里面的有些课程已经归档过了,但是还有个别的信息没有。感谢课程图谱的小编
介绍:【AFirstCourseinLinearAlgebra】RobertBeezer有答案有移动版、打印版使用GNU自由文档协议引用了杰弗逊1813年的信
介绍:libfacedetection是深圳大学开源的一个人脸图像识别库。包含正面和多视角人脸检测两个算法.优点:速度快(OpenCVhaar+adaboost的2-3倍),准确度高(FDDB非公开类评测排名第二),能估计人脸角度。
介绍:WSDM2015最佳论文把马尔可夫链理论用在了图分析上面,比一般的propagationmodel更加深刻一些。通过全局的平稳分布去求解每个节点影响系数模型。假设合理(转移受到相邻的影响系数影响)。可以用来反求每个节点的影响系数
介绍:CMU的统计系和计算机系知名教授LarryWasserman在《机器崛起》,对比了统计和机器学习的差异
介绍:用社交用户行为学习图片的协同特征,可更好地表达图片内容相似性。由于不依赖于人工标签(标注),可用于大规模图片处理,难在用户行为数据的获取和清洗;利用社会化特征的思路值得借鉴.
介绍:聚焦数据质量问题的应对,数据质量对各种规模企业的性能和效率都至关重要,文中总结出(不限于)22种典型数据质量问题显现的信号,以及典型的数据质量解决方案(清洗、去重、统一、匹配、权限清理等)
介绍:中文分词入门之资源.
介绍:来自Stanford,用神经网络实现快速准确的依存关系解析器
介绍:做深度学习如何选择GPU的建议
介绍:socialnetworkscourse
介绍:大规模机器学习流程的构建与部署.
介绍:人脸识别二次开发包,免费,可商用,有演示、范例、说明书.
介绍:信息检索排序模型BM25(BestingMatching)。1)从经典概率模型演变而来2)捕捉了向量空间模型中三个影响索引项权重的因子:IDF逆文档频率;TF索引项频率;文档长度归一化。3)并且含有集成学习的思想:组合了BM11和BM15两个模型。4)作者是BM25的提出者和Okapi实现者Robertson.
介绍:把来自target的attentionsignal加入sourceencodingCNN的输入,得到了比BBN的模型好的多neuralnetworkjointmodel
介绍:揭开印度菜的美味秘诀——通过对大量食谱原料关系的挖掘,发现印度菜美味的原因之一是其中的味道互相冲突,很有趣的文本挖掘研究
介绍:1)词频与其降序排序的关系,最著名的是语言学家齐夫(Zipf,1902-1950)1949年提出的Zipf‘slaw,即二者成反比关系.曼德勃罗(Mandelbrot,1924-2010)引入参数修正了对甚高频和甚低频词的刻画2)Heaps'law:词汇表与语料规模的平方根(这是一个参数,英语0.4-0.6)成正比
介绍:JürgenSchmidhuber在Reddit上的AMA(AskMeAnything)主题,有不少RNN和AI、ML的干货内容,关于开源&思想&方法&建议……耐心阅读,相信你也会受益匪浅.
介绍:成G上T的学术数据,HN近期热议话题,主题涉及机器学习、NLP、SNA等。下载最简单的方法,通过BT软件,RSS订阅各集合即可
介绍:深度学习的全面硬件指南,从GPU到RAM、CPU、SSD、PCIe
介绍:PedestrianDetectionpaper&data
介绍:【神经科学碰撞人工智能】在脸部识别上你我都是专家,即使细微的差别也能辨认。研究已证明人类和灵长类动物在面部加工上不同于其他物种,人类使用梭状回面孔区(FFA)。Khaligh-Razavi等通过计算机模拟出人脸识别的FFA活动,堪称神经科学与人工智能的完美结合。
介绍:deeplearning4j官网提供的实际应用场景NN选择参考表,列举了一些典型问题建议使用的神经网络
介绍:一个深度学习项目,提供了Python,C/C++,Java,Scala,Go多个版本的代码
介绍:自然语言处理的发展趋势——访卡内基梅隆大学爱德华·霍威教授.
介绍:Google对FacebookDeepFace的有力回击——FaceNet,在LFW(LabeledFacesintheWild)上达到99.63%准确率(新纪录),FaceNetembeddings可用于人脸识别、鉴别和聚类.
介绍:华盛顿大学PedroDomingos团队的DNN,提供论文和实现代码.
介绍:本文根据神经网络的发展历程,详细讲解神经网络语言模型在各个阶段的形式,其中的模型包含NNLM[Bengio,2003]、HierarchicalNNLM[Bengio,2005],Log-Bilinear[Hinton,2007],SENNA等重要变形,总结的特别好.
介绍:经典问题的新研究:利用文本和可读性特征分类垃圾邮件。
介绍:出自MIT,研究加密数据高效分类问题.
介绍:ChaseDavis在NICAR15上的主题报告材料,用Scikit-Learn做监督学习的入门例子.
介绍:这是一本自然语言处理的词典,从1998年开始到目前积累了成千上万的专业词语解释,如果你是一位刚入门的朋友.可以借这本词典让自己成长更快.
介绍:通过分析1930年至今的比赛数据,用PageRank计算世界杯参赛球队排行榜.
介绍:决策树
介绍:"面向视觉识别的CNN"课程设计报告集锦.近百篇,内容涉及图像识别应用的各个方面
介绍:用Spark的MLlib+GraphX做大规模LDA主题抽取.
介绍:基于深度学习的多标签分类,用基于RBM的DBN解决多标签分类(特征)问题
介绍:DeepMind论文集锦
介绍:深度学习卷积概念详解,深入浅出.
介绍:非常强大的Python的数据分析工具包.
介绍:2015文本分析(商业)应用综述.
介绍:深度学习框架、库调研及Theano的初步测试体会报告.
介绍:MIT的YoshuaBengio,IanGoodfellow,AaronCourville著等人讲深度学习的新书,还未定稿,线上提供Draftchapters收集反馈,超赞!强烈推荐.
介绍:Python下开源可持久化朴素贝叶斯分类库.
介绍:Paracelisadistributedcomputationalframeworkdesignedformachinelearningproblems,graphalgorithmsandscientificcomputinginC++.
介绍:开源汉语言处理包.
介绍:使用Ruby实现简单的神经网络例子.
介绍:神经网络黑客入门.
介绍:好多数据科学家名人推荐,还有资料.
介绍:作者发现,经过调参,传统的方法也能和word2vec取得差不多的效果。另外,无论作者怎么试,GloVe都比不过word2vec.
介绍:Stanford深度学习与自然语言处理课程,RichardSocher主讲.
介绍:机器学习中的重要数学概念.
介绍:卡耐基梅隆RyanTibshirani和LarryWasserman开设的机器学习课程,先修课程为机器学习(10-715)和中级统计学(36-705),聚焦统计理论和方法在机器学习领域应用.
介绍:对自然语言处理技术或者机器翻译技术感兴趣的亲们,请在提出自己牛逼到无以伦比的idea(自动归纳翻译规律、自动理解语境、自动识别语义等等)之前,请通过谷歌学术简单搜一下,如果谷歌不可用,这个网址有这个领域几大顶会的论文列表,切不可断章取义,胡乱假设.
介绍:NIPSCiML2014的PPT,NIPS是神经信息处理系统进展大会的英文简称.
介绍:斯坦福的深度学习课程的Projects每个人都要写一个论文级别的报告里面有一些很有意思的应用大家可以看看.
介绍:R语言线性回归多方案速度比较具体方案包括lm()、nls()、glm()、bayesglm()、nls()、mle2()、optim()和Stan’soptimizing()等.
介绍:文中提到的三篇论文(机器学习那些事、无监督聚类综述、监督分类综述)都很经典,Domnigos的机器学习课也很精彩
介绍:莱斯大学(RiceUniversity)的深度学习的概率理论.
介绍:视频+讲义:深度学习用于自然语言处理教程(NAACL13).
介绍:Quora怎么用机器学习.
介绍:DataSchool的机器学习基本概念教学.
介绍:一个基于OpenGL实现的卷积神经网络,支持Linux及Windows系.
介绍:基于Mahout和Elasticsearch的推荐系统.
介绍:FrancisX.Diebold的《(经济|商业|金融等领域)预测方法.
介绍:FrancisX.Diebold的《时序计量经济学》.
介绍:用于Web分析和数据挖掘的概率数据结构.
介绍:机器学习在导航上面的应用.
介绍:{swirl}数据训练营:R&数据科学在线交互教程.
介绍:DeepReinforcementLearning.
介绍:PDNN:APythonToolkitforDeepLearning.
介绍:大数据处理课.内容覆盖流处理、MapReduce、图算法等.
介绍:以往上千行代码概率编程(语言)实现只需50行.
介绍:用结构化模型来预测实时股票行情.
介绍:一般矩阵乘法(GEMM)对深度学习的重要性.
介绍:ACommunityofawesomeDistributedMachineLearningC++projects.
介绍:免费书:AzureML使用精要.
介绍:ADeepLearningTutorial:FromPerceptronstoDeepNetworks.
介绍:Portable,scalableandreliabledistributedmachinelearning.
介绍:CNN开源实现横向评测,参评框架包括Caffe、Torch-7、CuDNN、cudaconvnet2、fbfft、NervanaSystems等,NervanaSys表现突出.
介绍:卡耐基梅隆大学计算机学院语言技术系的资源大全,包括大量的NLP开源软件工具包,基础数据集,论文集,数据挖掘教程,机器学习资源.
介绍:华盛顿大学的MachineLearningPaperRepository.
介绍:机器学习速查表.
介绍:最新的Sparksummit会议资料.
介绍:EbookLearningSpark.
介绍:EbookAdvancedAnalyticswithSpark,EarlyReleaseEdition.
介绍:清华大学副教授,是图挖掘方面的专家。他主持设计和实现的Arnetminer是国内领先的图挖掘系统,该系统也是多个会议的支持商.
介绍:迁移学习的国际领军人物.
介绍:在半监督学习,multi-label学习和集成学习方面在国际上有一定的影响力.
介绍:信息检索,自然语言处理,机器翻译方面的专家.
介绍:Twitter新trends的基本实现框架.
介绍:Java机器学习算法库SmileMiner.
介绍:神经网络训练中的Tricks之高效BP,博主的其他博客也挺精彩的.
介绍:作者是NLP方向的硕士,短短几年内研究成果颇丰,推荐新入门的朋友阅读.
介绍:UCLA的JensPalsberg根据GoogleScholar建立了一个计算机领域的H-index牛人列表,我们熟悉的各个领域的大牛绝大多数都在榜上,包括1位诺贝尔奖得主,35位图灵奖得主,近百位美国工程院/科学院院士,300多位ACMFellow,在这里推荐的原因是大家可以在google通过搜索牛人的名字来获取更多的资源,这份资料很宝贵.
介绍:用大型语料库学习概念的层次关系,如鸟是鹦鹉的上级,鹦鹉是虎皮鹦鹉的上级。创新性在于模型构造,用因子图刻画概念之间依存关系,因引入兄弟关系,图有环,所以用有环扩散(loopypropagation)迭代计算边际概率(marginalprobability).
介绍:deepnethighlightsfrom2014.
介绍:ThispaperproposesFastR-CNN,acleanandfastframeworkforobjectdetection.
介绍:提供计算机视觉、机器视觉应用的公司信息汇总.应用领域包括:自动辅助驾驶和交通管理、眼球和头部跟踪、影视运动分析、影视业、手势识别、通用视觉系统、各种工业自动化和检验、医药和生物、移动设备目标识别和AR、人群跟踪、摄像、安全监控、生物监控、三维建模、web和云应用.
介绍:Python版可视化数据统计开源库.
介绍:快速入门:基于ApacheMahout的分布式机器学习.
介绍:基于scikit-learn讲解了一些机器学习技术,如SVM,NB,PCA,DT,以及特征工程、特征选择和模型选择问题.
介绍:WePay用机器学习对抗信用卡"shellselling"诈骗.
介绍:深度学习在大数据分析领域的应用和挑战.
介绍:一篇关于CNN模型对象识别Paper.
介绍:深度学习的统计分析V:泛化和正则化.
介绍:用SGD能高效完成训练的大规模(多层)深度网络HN.
介绍:Coursera上的推荐系统导论(IntroductiontoRecommenderSystems)公开课.
介绍:AndrewNg经典机器学习课程笔记.
介绍:推荐系统"个性化语义排序"模型.
介绍:激情时分更惜字——MIT的最新Twitter研究结果.
介绍:一个深度学习资源页,资料很丰富.
介绍:免费电子书"LearningDeepLearning".
介绍:MachineLearningforAstronomywithscikit-learn.
介绍:免费电子书"随机森林入门指南".
介绍:白话数据挖掘十大算法.
介绍:博士学位论文:ELM研究进展.
介绍:面向数据新闻的文本挖掘.
介绍:用网络图片合成延时视频(SIGGRAPH2015).
介绍:分类系统的维数灾难.
介绍:预测模型入门.
介绍:深入浅出LSTM.
介绍:BenJones的数据可视化建议.
介绍:解读数据降维/PCA/SVD.
介绍:IPN:监督学习方法示例/对比参考表,覆盖logistic回归,决策树,SVM,KNN,NaiveBayes等方法.
介绍:基于RankSVM和DNN自动(重组)生成Rap歌词.
介绍:随机索引RI词空间模型专题.
介绍:基于机器学习的漏洞检测工具VDiscover.
介绍:深度学习系统minerva。拥有python编程接口。多GPU几乎达到线性加速。在4块GPU上能在4天内将GoogLeNet训练到68.7%的top-1以及89.0%的top-5准确率。和同为dmlc项目的cxxnet相比,采用动态数据流引擎,提供更多灵活性。未来将和cxxnet一起整合为mxnet项目,互取优势.
介绍:2015年国际计算机视觉与模式识别会议paper.
介绍:基于Caffe的加速深度学习系统CcT.
介绍:深度学习(模型)低精度(训练与)存储.
介绍:新书预览:模型机器学习.
介绍:DeepLearning(深度学习)学习笔记整理系列.
介绍:神经(感知)机器翻译介绍.
介绍:论文:通过潜在知识迁移训练RNN.
介绍:面向金融数据的情感分析工具.
介绍:(Python)主题模型交互可视化库pyLDAvis.
介绍:Logistic回归与优化实例教程.
介绍:Theano/Blocks实现RNN手写字符串生成sketch.
介绍:基于TopSig的海量(7亿+)网页聚类.
介绍:NAACL2015论文papers.
介绍:机器学习预测股市的七个问题.
介绍:神经网络学习资料推荐.
介绍:面向序列学习的RNN综述.
介绍:R文本处理手册.
介绍:“必看”的Python视频集锦.
介绍:Google(基础结构)栈.
介绍:矩阵和数据的随机算法(UCBerkeley2013).
介绍:DataCamp中级R语言教程.
介绍:Scikit-learn是基于Scipy为机器学习建造的的一个Python模块,他的特色就是多样化的分类,回归和聚类的算法包括支持向量机,逻辑回归,朴素贝叶斯分类器,随机森林,GradientBoosting,聚类算法和DBSCAN。而且也设计出了Pythonnumerical和scientificlibrariesNumpyandScipy
介绍:Pylearn是一个让机器学习研究简单化的基于Theano的库程序。
介绍:Nilearn是一个能够快速统计学习神经影像数据的Python模块。它利用Python语言中的scikit-learn工具箱和一些进行预测建模,分类,解码,连通性分析的应用程序来进行多元的统计。
介绍:Pybrain是基于Python语言强化学习,人工智能,神经网络库的简称。它的目标是提供灵活、容易使用并且强大的机器学习算法和进行各种各样的预定义的环境中测试来比较你的算法。
介绍:Pattern是Python语言下的一个网络挖掘模块。它为数据挖掘,自然语言处理,网络分析和机器学习提供工具。它支持向量空间模型、聚类、支持向量机和感知机并且用KNN分类法进行分类。
介绍:Fuel为你的机器学习模型提供数据。他有一个共享如MNIST,CIFAR-10(图片数据集),Google’sOneBillionWords(文字)这类数据集的接口。你使用他来通过很多种的方式来替代自己的数据。
介绍:Skdata是机器学习和统计的数据集的库程序。这个模块对于玩具问题,流行的计算机视觉和自然语言的数据集提供标准的Python语言的使用。
介绍:MILK是Python语言下的机器学习工具包。它主要是在很多可得到的分类比如SVMS,K-NN,随机森林,决策树中使用监督分类法。它还执行特征选择。这些分类器在许多方面相结合,可以形成不同的例如无监督学习、密切关系金传播和由MILK支持的K-means聚类等分类系统。
介绍:IEPY是一个专注于关系抽取的开源性信息抽取工具。它主要针对的是需要对大型数据集进行信息提取的用户和想要尝试新的算法的科学家。
介绍:Quepy是通过改变自然语言问题从而在数据库查询语言中进行查询的一个Python框架。他可以简单的被定义为在自然语言和数据库查询中不同类型的问题。所以,你不用编码就可以建立你自己的一个用自然语言进入你的数据库的系统。现在Quepy提供对于Sparql和MQL查询语言的支持。并且计划将它延伸到其他的数据库查询语言。
介绍:Hebel是在Python语言中对于神经网络的深度学习的一个库程序,它使用的是通过PyCUDA来进行GPU和CUDA的加速。它是最重要的神经网络模型的类型的工具而且能提供一些不同的活动函数的激活功能,例如动力,涅斯捷罗夫动力,信号丢失和停止法。
介绍:它是一个由有用的工具和日常数据科学任务的扩展组成的一个库程序。
介绍:这个程序包容纳了大量能对你完成机器学习任务有帮助的实用程序模块。其中大量的模块和scikit-learn一起工作,其它的通常更有用。
介绍:这一系列工具通过与scikit-learn兼容的API,来创建和测试机器学习功能。这个库程序提供了一组工具,它会让你在许多机器学习程序使用中很受用。当你使用scikit-learn这个工具时,你会感觉到受到了很大的帮助。(虽然这只能在你有不同的算法时起作用。)
介绍:REP是以一种和谐、可再生的方式为指挥数据移动驱动所提供的一种环境。它有一个统一的分类器包装来提供各种各样的操作,例如TMVA,Sklearn,XGBoost,uBoost等等。并且它可以在一个群体以平行的方式训练分类器。同时它也提供了一个交互式的情节。
介绍:用亚马逊的机器学习建造的简单软件收集。
介绍:这是一个在Python语言下基于scikit-learn的极端学习机器的实现。