博客专栏推荐
-
1176966次
-
121919次
-
56731次
-
29226次
本月博客排行
年度博客排行
-
第1名
大家都说我很棒 -
第2名
zw7534313 -
第3名
青否云后端云 - liyihz2008
- wy_19921005
- sichunli_030
- 小taomi_77
- surmounting
- 腾讯优测1
- hbxflihua
- xiangjie88
- e_e
- wallimn
- ning2-eye
- dbagirl
- zysnba
- kaizi1992
- itdatacenter
- luxurioust
- robotmen
- alsmile
- gengyun12
- gaozzsoft
- johnsmith9th
- jywhltj
- fantaxy025025
- zhangdaiscott
- chinahuyong
- 淡看人生
- leslie26
- cuityang
- jveqi
- mukeliang728
- hellohank
- weiyides
- cpongo1
- zlr
- appalese
- hanbaohong
- zhaoshijie
- jackpot1234
- jickcai
- lzyfn123
- ssydxa219
- ranbuijj
- arpenker
- lyongq04
- xpenxpen
最新文章列表
java应用程序入口:
输入一个文本文件,这个java应用会利用spark的大数据处理功能,迅速统计出这个文本文件里每个单词出现的次数,按从高到低排序。
因为spark的核心代码是scala编写,因此也能直接在scala控制台里演示这个demo:
这个demo演示的命令行:
spark简介
spark是什么
spark是一个快读且通用的集群计算平台
spark的特点
spark应用程序可以使用r语言、java、scala和python进行编写,极少使用r语言编写spar ...
有198人浏览
2019-09-09 16:00
hanlp分词,如readme中所说,如果没有特殊需求,可以通过maven配置,如果要添加自定义词典,需要下载“依赖jar包和用户字典".
分享某大神的示例经验:
是直接"java xf hanlp-1.6.8-sources.jar" 解压源码,把源码加入工程(依赖本地jar包,有些麻烦,有时候到服务器有找不到jar包的情况)
按照文档操作,在spark ...
有445人浏览
2019-05-08 09:48
https://blog.csdn.net/xuefenxi/article/details/81083727
https://blog.csdn.net/lijiaqi0612/article/details/79384594
1.spark中的rdd是什么,有哪些特性?
答:rdd(resilient distributed dataset)叫做分布式数据集,是spark中最基本的数据 ...
有1281人浏览
2019-04-29 01:09
新发布1.7.0版本的hanlp自然语言处理工具包差不多已经有半年时间了,最近也是一直在整理这个新版本hanlp分词工具的相关内容。不过按照当前的整理进度,还需要一段时间再给大家详细分享整理的内容。昨天正好看到的这篇关于关于1.7.0版本hanlp分词在spark中的使用介绍的文章,顺便分享给大家一起学习一下!
以下为分享的文章内容:
hanlp分词,如readme中所说,如果没有 ...
有503人浏览
2019-03-11 15:09
« 上一页 1 …