Loading...

XML

Word

Printable

Details

Type: Bug
Resolution: User Error
Priority: Critical
Fix Version/s: 6.6.0
Affects Version/s: 6.6.0
Component/s: couchbase-bucket
Labels:
Environment:
6.6.0-7883-enterprise

Triage:
Untriaged
Operating System:
Centos 64-bit
Link to Log File, atop/blg, CBCollectInfo, Core dump:

Hide
https://cb-jira.s3.us-east-2.amazonaws.com/logs/rebalance_failure/collectinfo-2020-07-18T193819-ns_1%40172.23.105.163.zip
https://cb-jira.s3.us-east-2.amazonaws.com/logs/rebalance_failure/collectinfo-2020-07-18T193819-ns_1%40172.23.105.173.zip
https://cb-jira.s3.us-east-2.amazonaws.com/logs/rebalance_failure/collectinfo-2020-07-18T193819-ns_1%40172.23.105.5.zip
https://cb-jira.s3.us-east-2.amazonaws.com/logs/rebalance_failure/collectinfo-2020-07-18T193819-ns_1%40172.23.121.215.zip
https://cb-jira.s3.us-east-2.amazonaws.com/logs/rebalance_failure/collectinfo-2020-07-18T193819-ns_1%40172.23.123.143.zip
https://cb-jira.s3.us-east-2.amazonaws.com/logs/rebalance_failure/collectinfo-2020-07-18T193819-ns_1%40172.23.123.161.zip
https://cb-jira.s3.us-east-2.amazonaws.com/logs/rebalance_failure/collectinfo-2020-07-18T193819-ns_1%40172.23.105.200.zip

Show
https://cb-jira.s3.us-east-2.amazonaws.com/logs/rebalance_failure/collectinfo-2020-07-18T193819-ns_1%40172.23.105.163.zip https://cb-jira.s3.us-east-2.amazonaws.com/logs/rebalance_failure/collectinfo-2020-07-18T193819-ns_1%40172.23.105.173.zip https://cb-jira.s3.us-east-2.amazonaws.com/logs/rebalance_failure/collectinfo-2020-07-18T193819-ns_1%40172.23.105.5.zip https://cb-jira.s3.us-east-2.amazonaws.com/logs/rebalance_failure/collectinfo-2020-07-18T193819-ns_1%40172.23.121.215.zip https://cb-jira.s3.us-east-2.amazonaws.com/logs/rebalance_failure/collectinfo-2020-07-18T193819-ns_1%40172.23.123.143.zip https://cb-jira.s3.us-east-2.amazonaws.com/logs/rebalance_failure/collectinfo-2020-07-18T193819-ns_1%40172.23.123.161.zip https://cb-jira.s3.us-east-2.amazonaws.com/logs/rebalance_failure/collectinfo-2020-07-18T193819-ns_1%40172.23.105.200.zip
Story Points:
1
Is this a Regression?:
Unknown

Description

Build: 6.6.0-7883

Scenario:

7 node cluster, Ephemral bucket(replica=1)
Load 250000 docs into the bucket (SyncWrites)

Rebalance out 3 nodes from the cluster

+----------------+----------+--------------+

| Nodes          | Services | Status       |

+----------------+----------+--------------+

| 172.23.121.215 | kv       | Cluster node |

| 172.23.105.5   | [u'kv']  | --- OUT ---> |

| 172.23.105.173 | [u'kv']  | --- OUT ---> |

| 172.23.105.200 | [u'kv']  | --- OUT ---> |

| 172.23.105.163 | kv       | Cluster node |

| 172.23.123.143 | kv       | Cluster node |

| 172.23.123.161 | kv       | Cluster node |

+----------------+----------+--------------+

Observation:

Rebalance failed with reason with reason,

Rebalance exited with reason {pre_rebalance_janitor_run_failed,"default",

{error,unsafe_nodes,['ns_1@172.23.105.163']}}.

Rebalance Operation Id = bcddb51f49060183600aa7f4eaba6286

Test log: http://qa.sc.couchbase.com/job/test_suite_executor-TAF/44667/consoleText

Test case:

./testrunner -i /tmp/testexec.18646.ini sdk_retries=10,num_items=250000,GROUP=P0;durability,EXCLUDE_GROUP=not_for_ephemeral,durability=MAJORITY,bucket_type=ephemeral,rerun=False,get-cbcollect-info=True,collect_pcaps=True,log_level=info,upgrade_version=6.6.0-7883 -t rebalance_new.rebalance_out.RebalanceOutTests.rebalance_out_with_warming_up,value_size=1024,bucket_type=ephemeral,upgrade_version=6.6.0-7883,rerun=False,sdk_retries=10,GROUP=P0;durability,nodes_out=3,EXCLUDE_GROUP=not_for_ephemeral,max_verify=100000,get-cbcollect-info=False,replicas=1,durability=MAJORITY,log_level=debug,nodes_init=7,num_items=250000,infra_log_level=critical

Attachments

Gerrit Reviews

- Issue Only
- Show All Reviews
- Show Open Reviews
- Show All Issues
- Show Open Issues

For Gerrit Dashboard: MB-40536
#	Subject	Branch	Project	Status	CR	V
132831,10	MB-40536: Fix for ephemeral rebalance-out issue	mad-hatter	TAF	Status: MERGED	+2	+1
132936,2	MB-40536: Fix for ephemeral rebalance-out issue	master	TAF	Status: MERGED	+2	+1

Activity

People

Assignee:: Ashwin Govindarajulu

Reporter:: Ashwin Govindarajulu

Votes:: 0 Vote for this issue

Watchers:: 4 Start watching this issue

Dates

Created:: 18/Jul/20 12:47 PM

Updated:: 20/Jul/20 11:08 AM

Resolved:: 20/Jul/20 11:08 AM

Gerrit Reviews

There are no open Gerrit changes

Show There are 2 closed Gerrit changes

Hide There are 2 closed Gerrit changes

MB-40536: Fix for ephemeral rebalance-out issue: Gerrit Review:

MB-40536: Fix for ephemeral rebalance-out issue: Gerrit Review:

[Ephemeral] Rebalance out failed with reaon "unnsafe nodes"

Details

Description

Attachments

Gerrit Reviews

Activity

People

Dates

Gerrit Reviews

PagerDuty