发布时间:2022-06-29 文章分类:编程知识 投稿人:赵颖 字号: 默认 | | 超大 打印

信息检索Reading List

/* -*- author: Tan Menglong; email: tanmenglong_at_gmail; twitter/weibo: @crackcell; 转载请注明出处 -*- */

Table of Contents

  • 1 WTF?
  • 2 信息检索相关

    • 2.1 基础篇

      • 2.1.1 《信息检索导论》
      • 2.1.2 《深入搜索引擎》
      • 2.1.3 《Hadoop in Action》
      • 2.1.4 《机器学习》
      • 2.1.5 《信息论基础》
      • 2.1.6 论文
    • 2.2 提高篇

      • 2.2.1 《The Elements of Statistical Learning》
      • 2.2.2 《统计学习理论的本质》
      • 2.2.3 《Pattern Recognition and Machine Learning》
      • 2.2.4 《Learning with Kernels》
    • 2.3 可选

      • 2.3.1 《Natural Language Processing with Python》
      • 2.3.2 《Data Analysis with Open Source Tools》
      • 2.3.3 《Mahout in Action》
      • 2.3.4 《R in a Nutshell》
  • 3 more else?
  • 4 (未完待续⋯⋯)

1 WTF?

经理让我给一位新进入职的同学准备一些入职前的准备材料,考虑到后续会不断有新同学入职,就专门开一个帖子,整理下我觉得好的阅读材料。这里是假设读者为非信息检索相关学科的同学。 特别注意,我也是初学者,列出来也算是对自己的一个提醒。有啥意见建议或者推荐请留言告知,感激不尽。

2 信息检索相关

2.1 基础篇

2.1.1 《信息检索导论》

  • http://book.douban.com/subject/5252170/

2.1.2 《深入搜索引擎》

  • http://book.douban.com/subject/3729518/

2.1.3 《Hadoop in Action》

  • http://book.douban.com/subject/4049942/

2.1.4 《机器学习》

  • http://book.douban.com/subject/1102235/

2.1.5 《信息论基础》

  • http://book.douban.com/subject/1320174/

2.1.6 论文

  • Page, Lawrence; Brin, Sergey; Motwani, Rajeev and Winograd, Terry (1999). The PageRank citation ranking: Bringing order to the Web.
  • Arvind, Arasu; Junghoo, Cho; Hector, Garcia-Molina; Andreas, Paepcke; Sriram Raghavan. Searching the Web
  • Monika, Henzinger. Link Analysis in Web Information Retrieval
  • Amit, Singhal. Modern Information Retrieval: A Brief Overview
  • Norbert, Fuhr. Probabilistic Models in Information Retrieval
  • ChengXiang, Zhai. Statistical Language Models for Information Retrieval A Critical Review

2.2 提高篇

2.2.1 《The Elements of Statistical Learning》

  • http://book.douban.com/subject/3294335/

2.2.2 《统计学习理论的本质》

  • http://book.douban.com/subject/1507931/

2.2.3 《Pattern Recognition and Machine Learning》

  • http://book.douban.com/subject/2061116/

2.2.4 《Learning with Kernels》

  • http://book.douban.com/subject/1763633/

2.3 可选

2.3.1 《Natural Language Processing with Python》

  • http://book.douban.com/subject/3696989/

2.3.2 《Data Analysis with Open Source Tools》

  • http://book.douban.com/subject/4884975/

2.3.3 《Mahout in Action》

  • http://book.douban.com/subject/4893547/

2.3.4 《R in a Nutshell》

  • http://book.douban.com/subject/2586023/

3 more else?

除了基础的东西,还可以额外关注一些ir、ml等领域顶级学术会议的文章。比如sigir、icml等。也可以多了解下ir领域比较新的一些研究领域,比如learning to rank啥的。

4 (未完待续⋯⋯)

Author: crackcell <tanmenglong AT gmail DOT com>

Date: 2012-03-19 14:56:04 CST

HTML generated by org-mode 6.33x in emacs 23