Elasticsearch加载大量数据

本文介绍了一种从Elasticsearch批量导出数据的方法,使用Python的elasticsearch.helpers模块实现数据扫描,并将导出的ID记录到指定文件中。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

import os
import sys

from elasticsearch import Elasticsearch
from elasticsearch import helpers


def load_data(es, index_v, fpw):
	'''es: Elasticsearch对象,
	   index_v: 索引名
	   fpw: 文件写入对象
	'''
    query={"query" : {"match_all" : {}}}
    scanResp= helpers.scan(client=es, query=query, scroll="20m", index=index_v, timeout="10m")

    n = 0
    for resp in scanResp:
        try:
        	# 取出想要获取的数据
            qid = resp['_id']
        except Exception as err:
            print('err: %s, resp: %s' % (err, resp), file=sys.stderr)
            continue
        else:
            print(qid, file=fpw)
            n += 1
            if n % 10000 == 0:
                print(n)

if __name__ == '__main__':
    host = 'ip'
    port = '9200'

    config = {'es_server': [host, port]}
    es = Elasticsearch(config['es_server'])

    # index_v="index_name"
    index_v = sys.argv[1]

    # fpw = open('file_name', 'w')
    fpw = open(sys.argv[2], 'w')

    load_data(es, index_v, fpw)

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值