文章详情页
数据分析 - java 数据挖掘分析求思路
浏览:194日期:2023-12-12 14:01:15
问题描述
先说说我的想法吧:同时监控淘宝上很多物品的价格,然后获取价格走势(这个我打算自己写爬虫获取,然后存在数据库里),但是问题来了
我该怎么存储数据,使我能分析哪些物品在最近2天或7天的价格波动最大(最好是任意天数),这个地方该怎么实现比较好。总不能说每天我都要遍历一次数据库来求价格的差值吧,能不能有经验的大师指点下。
问题解答
回答1:总不能说每天我都要遍历一次数据库来求价格的差值吧 是觉得开销过大吗?那就把热点数据放Cache,过了这段热点时间就持久化到数据库。
热点数据可以是但不限于:
这几天刚采集的数据
最常常分析的日期段,比如2天、7天、1个月
回答2:这个和java没关系吧
回答3:数据分析的方法和java不是强相关的,java从某种角度说只是一种工具,可以将你的想法交给计算完成,可以实现你与计算机的交流,有基于java相关的haoop生态,可以了解一哈
回答4:需要分析的变动快的 --> 热数据 --> redis , 放在内存;长期的历史数据 --> 冷数据 --> mysql / oracle ,放在磁盘。
标签:
java
相关文章:
1. mysql sum去除重复2. 老师无限级分类有点难哟 不好理解3. python - Django ManyToManyField 字段数据在 admin后台 显示不正确,这是怎么回事?4. javascript - 怎样去除数组里的几个值,只提供该数组的下标的话5. 为什么span的color非要内联样式才起作用?6. javascript - swiper.js嵌套了swiper 初始设置不能向下一个滑动 结束后重新初始7. mysql 能不能创建一个 有列级函数 的联合视图?8. 提示内部服务错误什么问题9. python - pysciter 如何配置运行环境?10. php由5.3升级到5.6后,登录网站,返回的是php代码,不是登录界面,各位大神有知道的吗?
排行榜

网公网安备