Loading...

XML

Word

Printable

Details

Type: Bug
Resolution: Fixed
Priority: Critical
Fix Version/s: 6.5.0
Affects Version/s: 6.0.0
Component/s: fts
Labels:
- system-test

Triage:
Untriaged
Operating System:
Centos 64-bit
Link to Log File, atop/blg, CBCollectInfo, Core dump:

Hide
https://s3.amazonaws.com/cb-engineering/Aruna/collectinfo-2018-09-12T220509-ns_1%40172.23.104.114.zip
https://s3.amazonaws.com/cb-engineering/Aruna/collectinfo-2018-09-12T220509-ns_1%40172.23.104.148.zip
https://s3.amazonaws.com/cb-engineering/Aruna/collectinfo-2018-09-12T220509-ns_1%40172.23.104.68.zip
https://s3.amazonaws.com/cb-engineering/Aruna/collectinfo-2018-09-12T220509-ns_1%40172.23.96.219.zip
https://s3.amazonaws.com/cb-engineering/Aruna/collectinfo-2018-09-12T220509-ns_1%40172.23.96.220.zip
https://s3.amazonaws.com/cb-engineering/Aruna/collectinfo-2018-09-12T220509-ns_1%40172.23.96.221.zip
https://s3.amazonaws.com/cb-engineering/Aruna/collectinfo-2018-09-12T220509-ns_1%40172.23.96.223.zip

Show
https://s3.amazonaws.com/cb-engineering/Aruna/collectinfo-2018-09-12T220509-ns_1%40172.23.104.114.zip https://s3.amazonaws.com/cb-engineering/Aruna/collectinfo-2018-09-12T220509-ns_1%40172.23.104.148.zip https://s3.amazonaws.com/cb-engineering/Aruna/collectinfo-2018-09-12T220509-ns_1%40172.23.104.68.zip https://s3.amazonaws.com/cb-engineering/Aruna/collectinfo-2018-09-12T220509-ns_1%40172.23.96.219.zip https://s3.amazonaws.com/cb-engineering/Aruna/collectinfo-2018-09-12T220509-ns_1%40172.23.96.220.zip https://s3.amazonaws.com/cb-engineering/Aruna/collectinfo-2018-09-12T220509-ns_1%40172.23.96.221.zip https://s3.amazonaws.com/cb-engineering/Aruna/collectinfo-2018-09-12T220509-ns_1%40172.23.96.223.zip
Is this a Regression?:
Yes

Description

Build
6.0.0-1614

Testcase
./sequoia -scope tests/fts/scope_component_fts.yml -test tests/fts/test_fts_alice_component.yml -provider file:centos_second_cluster.yml @ scale =1

Steps:
1. Create a single node kv+fts cluster
2. Create 2 buckets on it, load 10M docs
3. Create 2 default indexes - scorch and up-side down on the cluster
4. While indexing is on,
add kv, kv+fts, fts, kv+fts nodes.
rebalance - goes through fine.
5. Now create 2 more indexes - scorch and upside_down with custom mapping
6. Add - fts, .kv+fts, kv
Remove 2 nodes added in step 4. Rebalance.
7. We then failover .78 and then rebalance.

Rebalance exited with reason {service_rebalance_failed,fts,

{rebalance_failed,

{service_error,

<<"nodes: sample, res: (*http.Response)(nil), urlUUID: monitor.UrlUUID{Url:\"http://172.23.96.219:8094\", UUID:\"a930699699909ebf12c8fd01d5d4e574\"}, kind: /api/stats, err: Get http://%40fts-cbauth:127688ce084d0544fa5ca3db80102158@172.23.96.219:8094/api/stats: EOF">>}}}

ns_orchestrator 000

ns_1@172.23.96.219

2:55:45 AM   Wed Sep 12, 2018

Bucket "default" rebalance does not seem to be swap rebalance

ns_vbucket_mover 000

ns_1@172.23.96.219

2:39:23 AM   Wed Sep 12, 2018

Bucket "default" loaded on node 'ns_1@172.23.96.221' in 0 seconds.

ns_memcached 000

ns_1@172.23.96.221

2:39:22 AM   Wed Sep 12, 2018

Started rebalancing bucket default

ns_rebalancer 000

ns_1@172.23.96.219

2:39:21 AM   Wed Sep 12, 2018

Node 'ns_1@172.23.104.114' saw that node 'ns_1@172.23.104.78' went down. Details: [{nodedown_reason,

connection_closed}]

ns_node_disco 005

ns_1@172.23.104.114

2:37:11 AM   Wed Sep 12, 2018

Node 'ns_1@172.23.104.148' saw that node 'ns_1@172.23.104.78' went down. Details: [{nodedown_reason,

connection_closed}]

ns_node_disco 005

ns_1@172.23.104.148

2:37:11 AM   Wed Sep 12, 2018

Node 'ns_1@172.23.104.68' saw that node 'ns_1@172.23.104.78' went down. Details: [{nodedown_reason,

connection_closed}]

ns_node_disco 005

ns_1@172.23.104.68

2:37:11 AM   Wed Sep 12, 2018

Node 'ns_1@172.23.96.220' saw that node 'ns_1@172.23.104.78' went down. Details: [{nodedown_reason,

connection_closed}]

ns_node_disco 005

ns_1@172.23.96.220

2:37:11 AM   Wed Sep 12, 2018

Node 'ns_1@172.23.96.221' saw that node 'ns_1@172.23.104.78' went down. Details: [{nodedown_reason,

connection_closed}]

ns_node_disco 005

ns_1@172.23.96.221

2:37:11 AM   Wed Sep 12, 2018

Node 'ns_1@172.23.96.219' saw that node 'ns_1@172.23.104.78' went down. Details: [{nodedown_reason,

connection_closed}]

ns_node_disco 005

ns_1@172.23.96.219

2:37:11 AM   Wed Sep 12, 2018

Node 'ns_1@172.23.96.223' saw that node 'ns_1@172.23.104.78' went down. Details: [{nodedown_reason,

connection_closed}]

ns_node_disco 005

ns_1@172.23.96.223

2:37:11 AM   Wed Sep 12, 2018

Bucket "other" rebalance does not seem to be swap rebalance

ns_vbucket_mover 000

ns_1@172.23.96.219

2:37:10 AM   Wed Sep 12, 2018

Bucket "other" loaded on node 'ns_1@172.23.96.221' in 0 seconds.

ns_memcached 000

ns_1@172.23.96.221

2:37:09 AM   Wed Sep 12, 2018

Started rebalancing bucket other

ns_rebalancer 000

ns_1@172.23.96.219

2:37:08 AM   Wed Sep 12, 2018

Deleting old data files of bucket "default"

ns_storage_conf 000

ns_1@172.23.96.221

2:37:08 AM   Wed Sep 12, 2018

Deleting old data files of bucket "other"

ns_storage_conf 000

ns_1@172.23.96.221

2:37:08 AM   Wed Sep 12, 2018

Node 'ns_1@172.23.104.78' is leaving cluster.

ns_cluster 001

ns_1@172.23.104.78

2:37:08 AM   Wed Sep 12, 2018

Starting rebalance, KeepNodes = ['ns_1@172.23.104.114','ns_1@172.23.104.148',

'ns_1@172.23.104.68','ns_1@172.23.96.219',

'ns_1@172.23.96.220','ns_1@172.23.96.221',

'ns_1@172.23.96.223'], EjectNodes = [], Failed over and being ejected nodes = ['ns_1@172.23.104.78']; no delta recovery nodes

Attachments

Issue Links

relates to

MB-31111 [System test]: FTS rebalance out failed with service_error

Closed

Gerrit Reviews

- Issue Only
- Show All Reviews
- Show Open Reviews
- Show All Issues
- Show Open Issues

No reviews matched the request. Check your Options in the drop-down menu of this sections header.

Activity

People

Assignee:: Aruna Piravi (Inactive)

Reporter:: Aruna Piravi (Inactive)

Votes:: 0 Vote for this issue

Watchers:: 7 Start watching this issue

Dates

Created:: 12/Sep/18 3:36 PM

Updated:: 18/Jul/19 3:32 PM

Resolved:: 19/Oct/18 9:51 AM

Gerrit Reviews

There are no open Gerrit changes

Show There is 1 closed Gerrit change

Hide There is 1 closed Gerrit change

MB-31258 - Rebalance fails over stats monitor errs: Gerrit Review:

[FTS - System test] Rebalance after failover fails with err: "nodes: sample, res: (*http.Response)(nil), urlUUID: monitor.UrlUUID{Url:\"http://172.23.96.219:8094\", UUID:\"a930699699909ebf12c8fd01d5d4e574\"}"

Details

Description

Attachments

Issue Links

Gerrit Reviews

Activity

People

Dates

Gerrit Reviews

PagerDuty