當前位置:學識都>好好學習>考研>

阿里巴巴集團筆試題目

學識都 人氣:1.68W

下面是由本站分享的筆試題目

阿里巴巴集團筆試題目

第一題、5億個不重複的商品的ID(每一個商品的ID是64位),現在有一個存放了10億個商品ID(商品的ID會有重複)的日誌文件,請設計一種方法找出5億個商品中沒有出現在日誌文件中的商品。假設所能使用的內存爲2G。
[html] view plaincopyprint?
01.2G的`文件只能存放2.5億的商品ID,因爲5億商品大小爲5*10^8*8B=4G。可以考慮將5億商品ID哈希到四個文件中A[4]。然後將10億個商品哈希到另外四個文件中B[4]。每次讀入一個A文件讀入一個B文件,將B文件哈希到A文件中,A文件中的值爲0的鍵值就是沒有被日誌文件包含的。但是日誌文件分成四個之後,每一個的大小事2G無法一次性的讀入,可以一次讀一半或者分成8個文件。以上爲博主的思路,歡迎各位指正。
2G的文件只能存放2.5億的商品ID,因爲5億商品大小爲5*10^8*8B=4G。可以考慮將5億商品ID哈希到四個文件中A[4]。然後將10億個商品哈希到另外四個文件中B[4]。每次讀入一個A文件讀入一個B文件,將B文件哈希到A文件中,A文件中的值爲0的鍵值就是沒有被日誌文件包含的。但是日誌文件分成四個之後,每一個的大小事2G無法一次性的讀入,可以一次讀一半或者分成8個文件。以上爲博主的思路,歡迎各位指正。[cpp] view plaincopyprint?
01.

第二題、有一個詞組的列表,list<string> wordlist={"a boy","hello word ","small cat",.......};有一個字符串string stringlist={“ a boy can catch small cats”}.

要求找出出現在stringlist中的wordlist的詞組。比如a boy就出現了,但是small cat沒出現。只要有一個出現了就返回true,否則返回false

[cpp] view plaincopyprint?
01. bool Find(list<string>wordlist,string stringlist)
02.{
03. int length=th();
04. int i;
05. for(i=0;i<length;i++)
06. {
07. if((wordlist[i])!=()&&*((wordlist[i])++)==' ')
08. {
09. return true;