2013 August 13 C/C++, Algorithm
统计单词出现数目(更新)
统计单词出现数目(更新)
这里有一个大文本(一些经典英文小说的集合),文件在解压后大约有20m。 文本中都是英文单词,空格以及英文的标点符号: [.,;-~”?’!] (句号,逗号,分号,破折号,波浪号,双引号,问号,单引号,感叹号)
任务要求:请统计出该文本中最常出现的前10个单词(不区分大小写)。 请注意,在统计中这20个单词请忽略(the, and, i, to, of, a, in, was, that, had, he, you, his, my, it, as, with, her, for, on)
说明: 1) 编程语言不限
2) 最终的测试机器为多核环境(单机)
3) 不得借助外部服务 (调用远程服务)
4) 可引用外部框架或库(限开源)
先放入map容器,然后计数。将他套入 vector< pair< string,int> > tVector; 中,然后重写cmp函数,使用sort(tVector.begin(), tVector.end(), cmp)排序。
version 1.0
> //输入单词,统计单词出现次数并按照单词出现次数从多到少排序 #include #include