Loading...

XML

Word

Printable

Details

Type: Bug
Resolution: Fixed
Priority: Major
Fix Version/s: None
Affects Version/s: 7.2.4
Component/s: query
Labels:
- Schwarz
Environment:
7.2.4-7007

Triage:
Untriaged
Link to Log File, atop/blg, CBCollectInfo, Core dump:

Hide
https://cb-engineering.s3.amazonaws.com/Systemtest_query_node_down/collectinfo-2024-03-28T131452-ns_1%40172.23.120.202.zip
https://cb-engineering.s3.amazonaws.com/Systemtest_query_node_down/collectinfo-2024-03-28T131452-ns_1%40172.23.218.83.zip
https://cb-engineering.s3.amazonaws.com/Systemtest_query_node_down/collectinfo-2024-03-28T131452-ns_1%40172.23.218.84.zip
https://cb-engineering.s3.amazonaws.com/Systemtest_query_node_down/collectinfo-2024-03-28T131452-ns_1%40172.23.218.85.zip
https://cb-engineering.s3.amazonaws.com/Systemtest_query_node_down/collectinfo-2024-03-28T131452-ns_1%40172.23.218.86.zip
https://cb-engineering.s3.amazonaws.com/Systemtest_query_node_down/collectinfo-2024-03-28T131452-ns_1%40172.23.218.87.zip
https://cb-engineering.s3.amazonaws.com/Systemtest_query_node_down/collectinfo-2024-03-28T131452-ns_1%40172.23.218.88.zip
https://cb-engineering.s3.amazonaws.com/Systemtest_query_node_down/collectinfo-2024-03-28T131452-ns_1%40172.23.218.89.zip
https://cb-engineering.s3.amazonaws.com/Systemtest_query_node_down/collectinfo-2024-03-28T131452-ns_1%40172.23.218.90.zip
https://cb-engineering.s3.amazonaws.com/Systemtest_query_node_down/collectinfo-2024-03-28T131452-ns_1%40172.23.218.91.zip
https://cb-engineering.s3.amazonaws.com/Systemtest_query_node_down/collectinfo-2024-03-28T131452-ns_1%40172.23.96.207.zip
https://cb-engineering.s3.amazonaws.com/Systemtest_query_node_down/collectinfo-2024-03-28T131452-ns_1%40172.23.96.231.zip

Show
https://cb-engineering.s3.amazonaws.com/Systemtest_query_node_down/collectinfo-2024-03-28T131452-ns_1%40172.23.120.202.zip https://cb-engineering.s3.amazonaws.com/Systemtest_query_node_down/collectinfo-2024-03-28T131452-ns_1%40172.23.218.83.zip https://cb-engineering.s3.amazonaws.com/Systemtest_query_node_down/collectinfo-2024-03-28T131452-ns_1%40172.23.218.84.zip https://cb-engineering.s3.amazonaws.com/Systemtest_query_node_down/collectinfo-2024-03-28T131452-ns_1%40172.23.218.85.zip https://cb-engineering.s3.amazonaws.com/Systemtest_query_node_down/collectinfo-2024-03-28T131452-ns_1%40172.23.218.86.zip https://cb-engineering.s3.amazonaws.com/Systemtest_query_node_down/collectinfo-2024-03-28T131452-ns_1%40172.23.218.87.zip https://cb-engineering.s3.amazonaws.com/Systemtest_query_node_down/collectinfo-2024-03-28T131452-ns_1%40172.23.218.88.zip https://cb-engineering.s3.amazonaws.com/Systemtest_query_node_down/collectinfo-2024-03-28T131452-ns_1%40172.23.218.89.zip https://cb-engineering.s3.amazonaws.com/Systemtest_query_node_down/collectinfo-2024-03-28T131452-ns_1%40172.23.218.90.zip https://cb-engineering.s3.amazonaws.com/Systemtest_query_node_down/collectinfo-2024-03-28T131452-ns_1%40172.23.218.91.zip https://cb-engineering.s3.amazonaws.com/Systemtest_query_node_down/collectinfo-2024-03-28T131452-ns_1%40172.23.96.207.zip https://cb-engineering.s3.amazonaws.com/Systemtest_query_node_down/collectinfo-2024-03-28T131452-ns_1%40172.23.96.231.zip
Story Points:
0
Is this a Regression?:
No

Description

I'm running a system test with 3 KV nodes + 6 index nodes + 1 query node. In this test I have 3 active buckets and few indexes and running continuous query load on them. This cluster undergoes cycle of Index and KV nodes in/out with services kill and rebalance retry. At no point in time I kill thing in query node, so I expect it to run without any issue.

However, I saw that query node was unresponsive and not available. I had to manually start couchbase service to bring the node up.

I'm not really sure what has lead to query node down. I see lots of file like this in /opt/couchbase/var/lib/couchbase/logs dir

-rw-rw---- 1 couchbase couchbase     1437 Mar 28 03:55 query_ffdc_MRE_areq_00310988_2024-03-28-035546.770.gz

-rw-rw---- 1 couchbase couchbase     1440 Mar 28 03:57 query_ffdc_MRE_areq_00310988_2024-03-28-035716.841.gz

-rw-rw---- 1 couchbase couchbase     1154 Mar 28 04:01 query_ffdc_MRE_areq_00310988_2024-03-28-040116.861.gz

-rw-rw---- 1 couchbase couchbase    45405 Mar 28 03:55 query_ffdc_MRE_grtn_00310988_2024-03-28-035546.770.gz

-rw-rw---- 1 couchbase couchbase    46653 Mar 28 03:57 query_ffdc_MRE_grtn_00310988_2024-03-28-035716.841.gz

-rw-rw---- 1 couchbase couchbase    48336 Mar 28 04:01 query_ffdc_MRE_grtn_00310988_2024-03-28-040116.861.gz

-rw-rw---- 1 couchbase couchbase   150214 Mar 28 03:55 query_ffdc_MRE_heap_00310988_2024-03-28-035546.770.gz

-rw-rw---- 1 couchbase couchbase   151079 Mar 28 03:57 query_ffdc_MRE_heap_00310988_2024-03-28-035716.841.gz

I've run the cbcollect logs manually as well.

s30401-deb11.zip

Attachments

- Sort By Name
- Sort By Date
- Ascending
- Descending
- Thumbnails
- List
- Download All

FFDC.tar
1.26 MB
31/Mar/24 11:03 PM
s30401-deb11.zip
9.90 MB
28/Mar/24 6:28 AM
s30401-deb11-1.zip
14.85 MB
31/Mar/24 11:03 PM

Gerrit Reviews

- Issue Only
- Show All Reviews
- Show Open Reviews
- Show All Issues
- Show Open Issues

No reviews matched the request. Check your Options in the drop-down menu of this sections header.

Activity

People

Assignee:: Hemant Rajput

Reporter:: Hemant Rajput

Votes:: 0 Vote for this issue

Watchers:: 5 Start watching this issue

Dates

Created:: 28/Mar/24 6:28 AM

Updated:: 11/Apr/24 6:23 AM

Resolved:: 11/Apr/24 6:23 AM

Gerrit Reviews

There are no open Gerrit changes

[System Test][MOI] Query node was down

Details

Description

Attachments

Attachments

Gerrit Reviews

Activity

People

Dates

Gerrit Reviews

PagerDuty