Loading...

Details

Type: Bug
Resolution: Fixed
Priority: Critical
Fix Version/s: 7.1.0
Affects Version/s: 7.0.0, 7.0.1, 7.0.2, 7.0.3, 7.1.0
Component/s: query
Labels:
- candidate-for-7.0.4
- system-test

Triage:
Untriaged
Link to Log File, atop/blg, CBCollectInfo, Core dump:

Hide
https://cb-jira.s3.us-east-2.amazonaws.com/cb-engineering/timed_out_queries/collectinfo-2022-03-03T004002-ns_1%40172.23.104.137.zip
https://cb-jira.s3.us-east-2.amazonaws.com/cb-engineering/timed_out_queries/collectinfo-2022-03-03T004002-ns_1%40172.23.104.155.zip
https://cb-jira.s3.us-east-2.amazonaws.com/cb-engineering/timed_out_queries/collectinfo-2022-03-03T004002-ns_1%40172.23.104.157.zip
https://cb-jira.s3.us-east-2.amazonaws.com/cb-engineering/timed_out_queries/collectinfo-2022-03-03T004002-ns_1%40172.23.104.5.zip
https://cb-jira.s3.us-east-2.amazonaws.com/cb-engineering/timed_out_queries/collectinfo-2022-03-03T004002-ns_1%40172.23.104.67.zip
https://cb-jira.s3.us-east-2.amazonaws.com/cb-engineering/timed_out_queries/collectinfo-2022-03-03T004002-ns_1%40172.23.104.69.zip
https://cb-jira.s3.us-east-2.amazonaws.com/cb-engineering/timed_out_queries/collectinfo-2022-03-03T004002-ns_1%40172.23.104.70.zip
https://cb-jira.s3.us-east-2.amazonaws.com/cb-engineering/timed_out_queries/collectinfo-2022-03-03T004002-ns_1%40172.23.105.107.zip
https://cb-jira.s3.us-east-2.amazonaws.com/cb-engineering/timed_out_queries/collectinfo-2022-03-03T004002-ns_1%40172.23.105.111.zip
https://cb-jira.s3.us-east-2.amazonaws.com/cb-engineering/timed_out_queries/collectinfo-2022-03-03T004002-ns_1%40172.23.105.168.zip
https://cb-jira.s3.us-east-2.amazonaws.com/cb-engineering/timed_out_queries/collectinfo-2022-03-03T004002-ns_1%40172.23.106.100.zip
https://cb-jira.s3.us-east-2.amazonaws.com/cb-engineering/timed_out_queries/collectinfo-2022-03-03T004002-ns_1%40172.23.106.188.zip
https://cb-jira.s3.us-east-2.amazonaws.com/cb-engineering/timed_out_queries/collectinfo-2022-03-03T004002-ns_1%40172.23.108.103.zip
https://cb-jira.s3.us-east-2.amazonaws.com/cb-engineering/timed_out_queries/collectinfo-2022-03-03T004002-ns_1%40172.23.120.107.zip
https://cb-jira.s3.us-east-2.amazonaws.com/cb-engineering/timed_out_queries/collectinfo-2022-03-03T004002-ns_1%40172.23.120.245.zip
https://cb-jira.s3.us-east-2.amazonaws.com/cb-engineering/timed_out_queries/collectinfo-2022-03-03T004002-ns_1%40172.23.121.117.zip
https://cb-jira.s3.us-east-2.amazonaws.com/cb-engineering/timed_out_queries/collectinfo-2022-03-03T004002-ns_1%40172.23.123.28.zip
https://cb-jira.s3.us-east-2.amazonaws.com/cb-engineering/timed_out_queries/collectinfo-2022-03-03T004002-ns_1%40172.23.96.148.zip
https://cb-jira.s3.us-east-2.amazonaws.com/cb-engineering/timed_out_queries/collectinfo-2022-03-03T004002-ns_1%40172.23.96.192.zip
https://cb-jira.s3.us-east-2.amazonaws.com/cb-engineering/timed_out_queries/collectinfo-2022-03-03T004002-ns_1%40172.23.96.251.zip
https://cb-jira.s3.us-east-2.amazonaws.com/cb-engineering/timed_out_queries/collectinfo-2022-03-03T004002-ns_1%40172.23.96.252.zip
https://cb-jira.s3.us-east-2.amazonaws.com/cb-engineering/timed_out_queries/collectinfo-2022-03-03T004002-ns_1%40172.23.96.253.zip
https://cb-jira.s3.us-east-2.amazonaws.com/cb-engineering/timed_out_queries/collectinfo-2022-03-03T004002-ns_1%40172.23.97.119.zip
https://cb-jira.s3.us-east-2.amazonaws.com/cb-engineering/timed_out_queries/collectinfo-2022-03-03T004002-ns_1%40172.23.97.121.zip
https://cb-jira.s3.us-east-2.amazonaws.com/cb-engineering/timed_out_queries/collectinfo-2022-03-03T004002-ns_1%40172.23.97.122.zip
https://cb-jira.s3.us-east-2.amazonaws.com/cb-engineering/timed_out_queries/collectinfo-2022-03-03T004002-ns_1%40172.23.97.239.zip
https://cb-jira.s3.us-east-2.amazonaws.com/cb-engineering/timed_out_queries/collectinfo-2022-03-03T004002-ns_1%40172.23.99.11.zip
https://cb-jira.s3.us-east-2.amazonaws.com/cb-engineering/timed_out_queries/collectinfo-2022-03-03T004002-ns_1%40172.23.99.20.zip
https://cb-jira.s3.us-east-2.amazonaws.com/cb-engineering/timed_out_queries/collectinfo-2022-03-03T004002-ns_1%40172.23.99.21.zip
https://cb-jira.s3.us-east-2.amazonaws.com/cb-engineering/timed_out_queries/collectinfo-2022-03-03T004002-ns_1%40172.23.99.25.zip

Show
https://cb-jira.s3.us-east-2.amazonaws.com/cb-engineering/timed_out_queries/collectinfo-2022-03-03T004002-ns_1%40172.23.104.137.zip https://cb-jira.s3.us-east-2.amazonaws.com/cb-engineering/timed_out_queries/collectinfo-2022-03-03T004002-ns_1%40172.23.104.155.zip https://cb-jira.s3.us-east-2.amazonaws.com/cb-engineering/timed_out_queries/collectinfo-2022-03-03T004002-ns_1%40172.23.104.157.zip https://cb-jira.s3.us-east-2.amazonaws.com/cb-engineering/timed_out_queries/collectinfo-2022-03-03T004002-ns_1%40172.23.104.5.zip https://cb-jira.s3.us-east-2.amazonaws.com/cb-engineering/timed_out_queries/collectinfo-2022-03-03T004002-ns_1%40172.23.104.67.zip https://cb-jira.s3.us-east-2.amazonaws.com/cb-engineering/timed_out_queries/collectinfo-2022-03-03T004002-ns_1%40172.23.104.69.zip https://cb-jira.s3.us-east-2.amazonaws.com/cb-engineering/timed_out_queries/collectinfo-2022-03-03T004002-ns_1%40172.23.104.70.zip https://cb-jira.s3.us-east-2.amazonaws.com/cb-engineering/timed_out_queries/collectinfo-2022-03-03T004002-ns_1%40172.23.105.107.zip https://cb-jira.s3.us-east-2.amazonaws.com/cb-engineering/timed_out_queries/collectinfo-2022-03-03T004002-ns_1%40172.23.105.111.zip https://cb-jira.s3.us-east-2.amazonaws.com/cb-engineering/timed_out_queries/collectinfo-2022-03-03T004002-ns_1%40172.23.105.168.zip https://cb-jira.s3.us-east-2.amazonaws.com/cb-engineering/timed_out_queries/collectinfo-2022-03-03T004002-ns_1%40172.23.106.100.zip https://cb-jira.s3.us-east-2.amazonaws.com/cb-engineering/timed_out_queries/collectinfo-2022-03-03T004002-ns_1%40172.23.106.188.zip https://cb-jira.s3.us-east-2.amazonaws.com/cb-engineering/timed_out_queries/collectinfo-2022-03-03T004002-ns_1%40172.23.108.103.zip https://cb-jira.s3.us-east-2.amazonaws.com/cb-engineering/timed_out_queries/collectinfo-2022-03-03T004002-ns_1%40172.23.120.107.zip https://cb-jira.s3.us-east-2.amazonaws.com/cb-engineering/timed_out_queries/collectinfo-2022-03-03T004002-ns_1%40172.23.120.245.zip https://cb-jira.s3.us-east-2.amazonaws.com/cb-engineering/timed_out_queries/collectinfo-2022-03-03T004002-ns_1%40172.23.121.117.zip https://cb-jira.s3.us-east-2.amazonaws.com/cb-engineering/timed_out_queries/collectinfo-2022-03-03T004002-ns_1%40172.23.123.28.zip https://cb-jira.s3.us-east-2.amazonaws.com/cb-engineering/timed_out_queries/collectinfo-2022-03-03T004002-ns_1%40172.23.96.148.zip https://cb-jira.s3.us-east-2.amazonaws.com/cb-engineering/timed_out_queries/collectinfo-2022-03-03T004002-ns_1%40172.23.96.192.zip https://cb-jira.s3.us-east-2.amazonaws.com/cb-engineering/timed_out_queries/collectinfo-2022-03-03T004002-ns_1%40172.23.96.251.zip https://cb-jira.s3.us-east-2.amazonaws.com/cb-engineering/timed_out_queries/collectinfo-2022-03-03T004002-ns_1%40172.23.96.252.zip https://cb-jira.s3.us-east-2.amazonaws.com/cb-engineering/timed_out_queries/collectinfo-2022-03-03T004002-ns_1%40172.23.96.253.zip https://cb-jira.s3.us-east-2.amazonaws.com/cb-engineering/timed_out_queries/collectinfo-2022-03-03T004002-ns_1%40172.23.97.119.zip https://cb-jira.s3.us-east-2.amazonaws.com/cb-engineering/timed_out_queries/collectinfo-2022-03-03T004002-ns_1%40172.23.97.121.zip https://cb-jira.s3.us-east-2.amazonaws.com/cb-engineering/timed_out_queries/collectinfo-2022-03-03T004002-ns_1%40172.23.97.122.zip https://cb-jira.s3.us-east-2.amazonaws.com/cb-engineering/timed_out_queries/collectinfo-2022-03-03T004002-ns_1%40172.23.97.239.zip https://cb-jira.s3.us-east-2.amazonaws.com/cb-engineering/timed_out_queries/collectinfo-2022-03-03T004002-ns_1%40172.23.99.11.zip https://cb-jira.s3.us-east-2.amazonaws.com/cb-engineering/timed_out_queries/collectinfo-2022-03-03T004002-ns_1%40172.23.99.20.zip https://cb-jira.s3.us-east-2.amazonaws.com/cb-engineering/timed_out_queries/collectinfo-2022-03-03T004002-ns_1%40172.23.99.21.zip https://cb-jira.s3.us-east-2.amazonaws.com/cb-engineering/timed_out_queries/collectinfo-2022-03-03T004002-ns_1%40172.23.99.25.zip
Story Points:
1
Is this a Regression?:
Unknown

Description

Build : 7.1.0-2416
Test : -test tests/integration/neo/test_neo_couchstore_milestone4.yml -scope tests/integration/neo/scope_couchstore.yml
Scale : 3
Iteration : 1st

There are 144 queries right now that are stuck in "timeout" or "submitted" state and is blocking a rebalance operation to add a new query node (172.23.104.137) to the cluster. This rebalance operation has been in progress for 5.5+ hrs, out of which more than 5 hrs it has been in the query service rebalance phase due to this issue.

select state,count(*) from system:active_requests where state!="running" group by state

    "$1": 128,

    "state": "timeout"

},

    "$1": 16,

    "state": "submitted"

1. Do we really need graceful shutdown when adding a new query node to the cluster ?
2. What is causing these queries to time out and be in the submitted state ?

Query nodes : 172.23.104.137, 172.23.104.155, 172.23.104.157

Attached :
1. cbcollect
2. active_requests dumps from all 3 nodes

Not sure if this is a regression or related to a recent change in the longevity to run N1QL statements in JS UDF. The previous run of the same test with 7.1.0-2400 did not show this issue.

UPDATE: rebalance completed successfully after I manually cancelled all the above queries.

Attachments

- Sort By Name
- Sort By Date
- Ascending
- Descending
- Thumbnails
- List
- Download All

query_active_requests_137.json
2 kB
02/Mar/22 4:54 PM
query_active_requests_155.json
10 kB
02/Mar/22 4:54 PM
query_active_requests_157.json
74 kB
02/Mar/22 4:54 PM

Issue Links

backports to

MB-51826 [BP of MB-51289 to 7.0.4] - [System Test] Queries stuck in timeout/submitted stage since 9+ hrs blocking rebalance

Closed

Gerrit Reviews

- Issue Only
- Show All Reviews
- Show Open Reviews
- Show All Issues
- Show Open Issues

No reviews matched the request. Check your Options in the drop-down menu of this sections header.

[System Test] Queries stuck in timeout/submitted stage since 9+ hrs blocking rebalance

Details

Description

Attachments

Attachments

Issue Links

Gerrit Reviews

Activity

People

Dates

Gerrit Reviews

PagerDuty