java字符串搜索匹配問題?
問題描述
我有三萬多個(gè)詞匯和它們的詞性(就是動(dòng)詞,名詞,形容詞或者副詞之類的),我想寫個(gè)函數(shù)把以參數(shù)的方式傳遞進(jìn)來的單詞進(jìn)行詞性分析,然后返回它的詞性。
public int analyze(String word){ // 這個(gè)地方應(yīng)該用什么來保存那三萬個(gè)詞匯 // 這個(gè)地方應(yīng)該用怎樣的數(shù)據(jù)結(jié)構(gòu)或算法來判斷word到底在不在我那個(gè)三萬個(gè)詞匯里面 // 怎么做才能功效地判斷出word的詞性 return wordType;}
詞匯-詞性表目前是單純的以行為單位的txt文件
word1 tword2 nword3 a
就這樣,我該怎么做呢,應(yīng)該用什么來存儲(chǔ)我的三萬行數(shù)據(jù),txt,json,xml,或者寫到代碼里面放到數(shù)組里面去呢?哪一個(gè)循環(huán)起來快一些,有什么好的建議?
問題解答
回答1:你的具體用途是怎樣的,經(jīng)常用到,注重查詢效率?可以用map放內(nèi)存吧
如果不經(jīng)常使用,可以按首字母將詞分割成幾個(gè)文件,每次查詢都可以定位到某個(gè)文件,更快一點(diǎn)。說實(shí)話,三萬其實(shí)挺小的,讀起來應(yīng)該不慢,再夸張點(diǎn)你可以放數(shù)據(jù)庫(kù)。
如果有更好的想法再回復(fù)你
回答2:可以試下hadoop的 map reduce 哦
相關(guān)文章:
1. javascript - 關(guān)于<a>元素與<input>元素的JS事件運(yùn)行問題2. css3 - 純css實(shí)現(xiàn)點(diǎn)擊特效3. docker start -a dockername 老是卡住,什么情況?4. java - 為什么第一個(gè)線程已經(jīng)釋放了鎖,第二個(gè)線程卻不行?5. mysql - 記得以前在哪里看過一個(gè)估算時(shí)間的網(wǎng)站6. javascript - vscode alt+shift+f 格式化js代碼,通不過eslint的代碼風(fēng)格檢查怎么辦。。。7. 大家好,我想請(qǐng)問一下怎么做搜索欄能夠搜索到自己網(wǎng)站的內(nèi)容。8. python - 啟動(dòng)Eric6時(shí)報(bào)錯(cuò):’qscintilla_zh_CN’ could not be loaded9. html - vue項(xiàng)目中用到了elementUI問題10. mysql - 查詢字段做了索引為什么不起效,還有查詢一個(gè)月的時(shí)候數(shù)據(jù)都是全部出來的,如果分拆3次的話就沒問題,為什么呢。
