文章详情页
java字符串搜索匹配问题?
浏览:216日期:2024-01-16 14:46:25
问题描述
我有三万多个词汇和它们的词性(就是动词,名词,形容词或者副词之类的),我想写个函数把以参数的方式传递进来的单词进行词性分析,然后返回它的词性。
public int analyze(String word){ // 这个地方应该用什么来保存那三万个词汇 // 这个地方应该用怎样的数据结构或算法来判断word到底在不在我那个三万个词汇里面 // 怎么做才能功效地判断出word的词性 return wordType;}
词汇-词性表目前是单纯的以行为单位的txt文件
word1 tword2 nword3 a
就这样,我该怎么做呢,应该用什么来存储我的三万行数据,txt,json,xml,或者写到代码里面放到数组里面去呢?哪一个循环起来快一些,有什么好的建议?
问题解答
回答1:你的具体用途是怎样的,经常用到,注重查询效率?可以用map放内存吧
如果不经常使用,可以按首字母将词分割成几个文件,每次查询都可以定位到某个文件,更快一点。说实话,三万其实挺小的,读起来应该不慢,再夸张点你可以放数据库。
如果有更好的想法再回复你
回答2:可以试下hadoop的 map reduce 哦
标签:
java
相关文章:
1. javascript - 一排三个框,各个框的间距是15px,距离外面的白框间距也是15px,这个css怎么写?2. javascript - 如何利用vue组件 动态生成router-link3. html5 - javascript写业务有用到什么编程范式没?4. html5 - vue-cli 装好了 新建项目的好了,找不到项目是怎么回事?5. javascript - immutable配合react提升性能?6. javascript - vue 手机端项目在进入主页后 在进入子页面,直接按返回出现空白情况7. css3 - 微信前端页面遇到的transition过渡动画的bug8. javascript - jQuery post()方法,里面的请求串可以转换为GBK编码么?可以的话怎样转换?9. python3.x - python 中的maketrans在utf-8文件中该怎么使用10. mysql - C#连接数据库时一直这一句出问题int i = cmd.ExecuteNonQuery();
排行榜

网公网安备