elasticsearch源数据容量与索引容量的大小比例与很多因素有关,没有一个比较固定的比例。
首先,是否存 _all有着最大的影响,如果你的es不是拿来做全文检索,那么这个_all可以不用存;
其次是 _source(是否存原始数据);
最后是对多少个字段分词,多少个字段建索引,使用什么分词器等(用ik max 明显会比 ik smart 大很多)。
一般如果不存_all,只对需要的字段分词和建索引的话,索引数据不会比原始数据膨胀太多,加上副本或许就跟原始数据一样大,因为索引数据会压缩。
这里分享一套elasticsearch经典入门视频:
链接:http://pan.baidu.com/s/1qYrgyPe 密码:s9sr