Loading...

XML

Word

Printable

Details

Type: Bug
Resolution: Fixed
Priority: Blocker
Fix Version/s: 7.0.0
Affects Version/s: Cheshire-Cat
Component/s: XDCR
Labels:

Triage:
Untriaged
Link to Log File, atop/blg, CBCollectInfo, Core dump:

Hide
https://cb-jira.s3.us-east-2.amazonaws.com/logs/mixed_mode_cluster_add_new_node/collectinfo-2021-04-23T230138-ns_1%40172.23.107.126.zip
https://cb-jira.s3.us-east-2.amazonaws.com/logs/mixed_mode_cluster_add_new_node/collectinfo-2021-04-23T230138-ns_1%40172.23.107.129.zip
https://cb-jira.s3.us-east-2.amazonaws.com/logs/mixed_mode_cluster_add_new_node/collectinfo-2021-04-23T230138-ns_1%40172.23.107.142.zip

Logs from Bharath
https://cb-jira.s3.us-east-2.amazonaws.com/MB-45893/collectinfo-2021-04-26T111620-ns_1%40172.23.104.247.zip
https://cb-jira.s3.us-east-2.amazonaws.com/MB-45893/collectinfo-2021-04-26T111620-ns_1%40172.23.105.1.zip
https://cb-jira.s3.us-east-2.amazonaws.com/MB-45893/collectinfo-2021-04-26T111620-ns_1%40172.23.105.137.zip
https://cb-jira.s3.us-east-2.amazonaws.com/MB-45893/collectinfo-2021-04-26T111620-ns_1%40172.23.105.183.zip
https://cb-jira.s3.us-east-2.amazonaws.com/MB-45893/collectinfo-2021-04-26T111620-ns_1%40172.23.106.116.zip : Upgrade node (7.0.0-5017)
https://cb-jira.s3.us-east-2.amazonaws.com/MB-45893/collectinfo-2021-04-26T111620-ns_1%40172.23.107.126.zip
https://cb-jira.s3.us-east-2.amazonaws.com/MB-45893/collectinfo-2021-04-26T111620-ns_1%40172.23.107.127.zip : Node being swapped out
https://cb-jira.s3.us-east-2.amazonaws.com/MB-45893/collectinfo-2021-04-26T111620-ns_1%40172.23.107.129.zip
https://cb-jira.s3.us-east-2.amazonaws.com/MB-45893/collectinfo-2021-04-26T111620-ns_1%40172.23.107.131.zip
https://cb-jira.s3.us-east-2.amazonaws.com/MB-45893/collectinfo-2021-04-26T111620-ns_1%40172.23.107.142.zip
https://cb-jira.s3.us-east-2.amazonaws.com/MB-45893/collectinfo-2021-04-26T111620-ns_1%40172.23.107.146.zip

Show
https://cb-jira.s3.us-east-2.amazonaws.com/logs/mixed_mode_cluster_add_new_node/collectinfo-2021-04-23T230138-ns_1%40172.23.107.126.zip https://cb-jira.s3.us-east-2.amazonaws.com/logs/mixed_mode_cluster_add_new_node/collectinfo-2021-04-23T230138-ns_1%40172.23.107.129.zip https://cb-jira.s3.us-east-2.amazonaws.com/logs/mixed_mode_cluster_add_new_node/collectinfo-2021-04-23T230138-ns_1%40172.23.107.142.zip Logs from Bharath https://cb-jira.s3.us-east-2.amazonaws.com/MB-45893/collectinfo-2021-04-26T111620-ns_1%40172.23.104.247.zip https://cb-jira.s3.us-east-2.amazonaws.com/MB-45893/collectinfo-2021-04-26T111620-ns_1%40172.23.105.1.zip https://cb-jira.s3.us-east-2.amazonaws.com/MB-45893/collectinfo-2021-04-26T111620-ns_1%40172.23.105.137.zip https://cb-jira.s3.us-east-2.amazonaws.com/MB-45893/collectinfo-2021-04-26T111620-ns_1%40172.23.105.183.zip https://cb-jira.s3.us-east-2.amazonaws.com/MB-45893/collectinfo-2021-04-26T111620-ns_1%40172.23.106.116.zip : Upgrade node (7.0.0-5017) https://cb-jira.s3.us-east-2.amazonaws.com/MB-45893/collectinfo-2021-04-26T111620-ns_1%40172.23.107.126.zip https://cb-jira.s3.us-east-2.amazonaws.com/MB-45893/collectinfo-2021-04-26T111620-ns_1%40172.23.107.127.zip : Node being swapped out https://cb-jira.s3.us-east-2.amazonaws.com/MB-45893/collectinfo-2021-04-26T111620-ns_1%40172.23.107.129.zip https://cb-jira.s3.us-east-2.amazonaws.com/MB-45893/collectinfo-2021-04-26T111620-ns_1%40172.23.107.131.zip https://cb-jira.s3.us-east-2.amazonaws.com/MB-45893/collectinfo-2021-04-26T111620-ns_1%40172.23.107.142.zip https://cb-jira.s3.us-east-2.amazonaws.com/MB-45893/collectinfo-2021-04-26T111620-ns_1%40172.23.107.146.zip
Story Points:
1
Is this a Regression?:
Unknown

Description

Steps to repro :
1. Setup a 2-node cluster running 6.6.2-9588 with kv+n1ql+index+fts services on both nodes
2. Install the sample buckets and create FTS indexes
3. Swap rebalance node2 with a spare node running 7.0.0-5016.
4. The cluster will now be in mixed mode
5. Add a new 7.0 node to the cluster.

The rebalance fails with error :

Rebalance exited with reason {pre_rebalance_janitor_run_failed,

"travel-sample",

{error,wait_for_memcached_failed,

['ns_1@172.23.107.142']}}.

Rebalance Operation Id = fda046d63e6f8a8b8014af2288bb470a

6. Retried the rebalance. That too failed as ns_server on the existing 7.0 node 172.23.107.142 has crashed with the following error -

Service 'ns_server' exited with status 1. Restarting. Messages:

working as port

4092: Booted. Waiting for shutdown request

working as port

eheap_alloc: Cannot allocate 1573200 bytes of memory (of type "heap").

Crash dump is being written to: erl_crash.dump...done

[os_mon] win32 supervisor port (win32sysinfo): Erlang has closed

Attachments

- Sort By Name
- Sort By Date
- Ascending
- Descending
- Thumbnails
- List
- Download All

screenshot-1.png
32 kB
26/Apr/21 11:26 AM
screenshot-2.png
37 kB
26/Apr/21 11:28 AM
screenshot-3.png
31 kB
26/Apr/21 11:29 AM
screenshot-4.png
48 kB
26/Apr/21 12:26 PM

Issue Links

is caused by

MB-45935 XDCR - memory leak when pipeline restarts repeatedly

Closed

is duplicated by

MB-45895 [Windows] Online upgrade with swap rebalance failed with reason mover_crashed, wait_seqno_persisted_failed

Closed

relates to

MB-44823 XDCR hitting pools/nodes endpoint should be coordinated

Closed

MB-45892 [Upgrade][XDCR][UI] Errors thrown while upgrading source cluster from 6.6.2 to 7.0.0

Closed

Gerrit Reviews

- Issue Only
- Show All Reviews
- Show Open Reviews
- Show All Issues
- Show Open Issues

No reviews matched the request. Check your Options in the drop-down menu of this sections header.

Activity

People

Assignee:: Mihir Kamdar (Inactive)

Reporter:: Mihir Kamdar (Inactive)

Votes:: 0 Vote for this issue

Watchers:: 9 Start watching this issue

Dates

Created:: 23/Apr/21 4:10 PM

Updated:: 17/Jun/21 3:55 PM

Resolved:: 27/Apr/21 12:21 PM

Gerrit Reviews

There are no open Gerrit changes

Windows : Unable to add a new 7.0 node to a mixed mode cluster - pre_rebalance_janitor_run_failed

Details

Description

Attachments

Attachments

Issue Links

Gerrit Reviews

Activity

People

Dates

Gerrit Reviews

PagerDuty