我创建了一个名为 mypipeline 的管道,并在 pipeline.yml(多管道)中与其他管道一起执行它。
这里的问题是我既没有任何唯一的 id 或标识符列,也没有显示修改日期的时间戳。
mypipeline.conf
input {
jdbc {
id => "database"
jdbc_driver_library => "my_driver"
jdbc_driver_class => "my_driver_class"
jdbc_connection_string => "my_connection"
jdbc_user => "db_user"
jdbc_password => "db_password"
jdbc_paging_enabled => true
statement_filepath => "mysql_query.sql"
}
}
filter {
mutate {
id => "remove_fields"
remove_field => [ "@version" ]
}
}
output {
elasticsearch {
id => "els_cluster"
action => "index"
index => "my_index"
template_name => "my_index_template"
hosts => [
"https://myhost1.com:9200",
"https://myhost2.com:9200",
"https://myhost3.com:9200",
"https://myhost4.com:9200"
]
cacert => '/mycertificate.cer'
user => "my_user"
password => "my_password"
我有两个Logstash节点,数据库中有700万条数据。 如果我在两个节点(或一个节点)上启动logstash,它会继续获取数据并且不会停止。 我使用Logstash 8.11.4版本。
你知道如何用两个节点读取 700 万条数据吗?