[ML][Data Frame] Adding bwc tests for pivot transform (elastic#43506)

* [ML][Data Frame] Adding bwc tests for pivot transform * adding continuous transforms * adding continuous dataframes to bwc * adding continuous data frame tests * Adding rolling upgrade tests for continuous df * Fixing test * Adjusting indices used in BWC, and handling NPE for seq_no_stats * updating and muting specific bwc test
benwtrent · Jul 3, 2019 · a44b600 · a44b600
1 parent 3250cc5
commit a44b600
Show file tree

Hide file tree

Showing 7 changed files with 1,068 additions and 1 deletion.
diff --git a/...va/org/elasticsearch/xpack/dataframe/checkpoint/DataFrameTransformsCheckpointService.java b/...va/org/elasticsearch/xpack/dataframe/checkpoint/DataFrameTransformsCheckpointService.java
@@ -15,6 +15,8 @@
 import org.elasticsearch.action.admin.indices.stats.IndicesStatsRequest;
 import org.elasticsearch.action.admin.indices.stats.ShardStats;
 import org.elasticsearch.client.Client;
+import org.elasticsearch.common.Strings;
+import org.elasticsearch.index.seqno.SeqNoStats;
 import org.elasticsearch.xpack.core.ClientHelper;
 import org.elasticsearch.xpack.core.dataframe.transforms.DataFrameTransformCheckpoint;
 import org.elasticsearch.xpack.core.dataframe.transforms.DataFrameTransformCheckpointStats;
@@ -222,6 +224,16 @@ static Map<String, long[]> extractIndexCheckPoints(ShardStats[] shards, Set<Stri
         for (ShardStats shard : shards) {
             String indexName = shard.getShardRouting().getIndexName();
             if (userIndices.contains(indexName)) {
+                SeqNoStats seqNoStats = shard.getSeqNoStats();
+                // SeqNoStats could be `null`. This indicates that an `AlreadyClosed` exception was thrown somewhere down the stack
+                // Indicates that the index COULD be closed, or at least that the shard is not fully recovered yet.
+                if (seqNoStats == null) {
+                    logger.warn("failure gathering checkpoint information for index [{}] as seq_no_stats were null. Shard Stats [{}]",
+                        indexName,
+                        Strings.toString(shard));
+                    throw new CheckpointException(
+                        "Unable to gather checkpoint information for index [" + indexName + "]. seq_no_stats are missing.");
+                }
                 if (checkpointsByIndex.containsKey(indexName)) {
                     // we have already seen this index, just check/add shards
                     TreeMap<Integer, Long> checkpoints = checkpointsByIndex.get(indexName);

diff --git a/x-pack/qa/rolling-upgrade/build.gradle b/x-pack/qa/rolling-upgrade/build.gradle
@@ -231,7 +231,8 @@ for (Version version : bwcVersions.wireCompatible) {
             'mixed_cluster/10_basic/Start scroll in mixed cluster on upgraded node that we will continue after upgrade',
             'mixed_cluster/30_ml_jobs_crud/Create a job in the mixed cluster and write some data',
             'mixed_cluster/40_ml_datafeed_crud/Put job and datafeed without aggs in mixed cluster',
-            'mixed_cluster/40_ml_datafeed_crud/Put job and datafeed with aggs in mixed cluster'
+            'mixed_cluster/40_ml_datafeed_crud/Put job and datafeed with aggs in mixed cluster',
+            'mixed_cluster/80_data_frame_jobs_crud/Test put batch data frame transforms on mixed cluster'
         ].join(',')
         finalizedBy "${baseName}#oldClusterTestCluster#node1.stop"
     }

diff --git a/.../rolling-upgrade/src/test/java/org/elasticsearch/upgrades/DataFrameSurvivesUpgradeIT.java b/.../rolling-upgrade/src/test/java/org/elasticsearch/upgrades/DataFrameSurvivesUpgradeIT.java
@@ -0,0 +1,279 @@
+/*
+ * Copyright Elasticsearch B.V. and/or licensed to Elasticsearch B.V. under one
+ * or more contributor license agreements. Licensed under the Elastic License;
+ * you may not use this file except in compliance with the Elastic License.
+ */
+package org.elasticsearch.upgrades;
+
+import org.apache.http.entity.ContentType;
+import org.apache.http.entity.StringEntity;
+import org.apache.lucene.util.LuceneTestCase;
+import org.elasticsearch.Version;
+import org.elasticsearch.client.Request;
+import org.elasticsearch.client.Response;
+import org.elasticsearch.client.dataframe.GetDataFrameTransformStatsResponse;
+import org.elasticsearch.client.dataframe.transforms.DataFrameTransformConfig;
+import org.elasticsearch.client.dataframe.transforms.DataFrameTransformStateAndStats;
+import org.elasticsearch.client.dataframe.transforms.DataFrameTransformTaskState;
+import org.elasticsearch.client.dataframe.transforms.DestConfig;
+import org.elasticsearch.client.dataframe.transforms.SourceConfig;
+import org.elasticsearch.client.dataframe.transforms.TimeSyncConfig;
+import org.elasticsearch.client.dataframe.transforms.pivot.GroupConfig;
+import org.elasticsearch.client.dataframe.transforms.pivot.PivotConfig;
+import org.elasticsearch.client.dataframe.transforms.pivot.TermsGroupSource;
+import org.elasticsearch.common.Booleans;
+import org.elasticsearch.common.Strings;
+import org.elasticsearch.common.unit.TimeValue;
+import org.elasticsearch.common.xcontent.DeprecationHandler;
+import org.elasticsearch.common.xcontent.NamedXContentRegistry;
+import org.elasticsearch.common.xcontent.XContentBuilder;
+import org.elasticsearch.common.xcontent.XContentParser;
+import org.elasticsearch.common.xcontent.XContentType;
+import org.elasticsearch.search.aggregations.AggregationBuilders;
+import org.elasticsearch.search.aggregations.AggregatorFactories;
+import org.elasticsearch.xpack.test.rest.XPackRestTestConstants;
+
+import java.io.IOException;
+import java.time.Instant;
+import java.util.ArrayList;
+import java.util.Collection;
+import java.util.List;
+import java.util.concurrent.TimeUnit;
+import java.util.stream.Collectors;
+import java.util.stream.Stream;
+
+import static org.elasticsearch.common.xcontent.XContentFactory.jsonBuilder;
+import static org.hamcrest.Matchers.equalTo;
+import static org.hamcrest.Matchers.greaterThan;
+import static org.hamcrest.Matchers.greaterThanOrEqualTo;
+import static org.hamcrest.Matchers.hasSize;
+
+@LuceneTestCase.AwaitsFix(bugUrl = "https://github.com/elastic/elasticsearch/issues/43662")
+public class DataFrameSurvivesUpgradeIT extends AbstractUpgradeTestCase {
+
+    private static final Version UPGRADE_FROM_VERSION = Version.fromString(System.getProperty("tests.upgrade_from_version"));
+    private static final String DATAFRAME_ENDPOINT = "/_data_frame/transforms/";
+    private static final String CONTINUOUS_DATA_FRAME_ID = "continuous-data-frame-upgrade-job";
+    private static final String CONTINUOUS_DATA_FRAME_SOURCE = "data-frame-upgrade-continuous-source";
+    private static final List<String> ENTITIES = Stream.iterate(1, n -> n + 1)
+        .limit(5)
+        .map(v -> "user_" + v)
+        .collect(Collectors.toList());
+    private static final List<TimeValue> BUCKETS = Stream.iterate(1, n -> n + 1)
+        .limit(5)
+        .map(TimeValue::timeValueMinutes)
+        .collect(Collectors.toList());
+
+    @Override
+    protected Collection<String> templatesToWaitFor() {
+        return Stream.concat(XPackRestTestConstants.DATA_FRAME_TEMPLATES.stream(),
+            super.templatesToWaitFor().stream()).collect(Collectors.toSet());
+    }
+
+    protected static void waitForPendingDataFrameTasks() throws Exception {
+        waitForPendingTasks(adminClient(), taskName -> taskName.startsWith("data_frame/transforms") == false);
+    }
+
+    /**
+     * The purpose of this test is to ensure that when a job is open through a rolling upgrade we upgrade the results
+     * index mappings when it is assigned to an upgraded node even if no other ML endpoint is called after the upgrade
+     */
+    public void testDataFramesRollingUpgrade() throws Exception {
+        assumeTrue("Continuous data frames not supported until 7.3", UPGRADE_FROM_VERSION.onOrAfter(Version.V_7_3_0));
+        Request waitForYellow = new Request("GET", "/_cluster/health");
+        waitForYellow.addParameter("wait_for_nodes", "3");
+        waitForYellow.addParameter("wait_for_status", "yellow");
+        switch (CLUSTER_TYPE) {
+            case OLD:
+                createAndStartContinuousDataFrame();
+                break;
+            case MIXED:
+                client().performRequest(waitForYellow);
+                long lastCheckpoint = 1;
+                if (Booleans.parseBoolean(System.getProperty("tests.first_round")) == false) {
+                    lastCheckpoint = 2;
+                }
+                verifyContinuousDataFrameHandlesData(lastCheckpoint);
+                break;
+            case UPGRADED:
+                client().performRequest(waitForYellow);
+                verifyContinuousDataFrameHandlesData(3);
+                cleanUpTransforms();
+                break;
+            default:
+                throw new UnsupportedOperationException("Unknown cluster type [" + CLUSTER_TYPE + "]");
+        }
+    }
+
+    private void cleanUpTransforms() throws Exception {
+        stopTransform(CONTINUOUS_DATA_FRAME_ID);
+        deleteTransform(CONTINUOUS_DATA_FRAME_ID);
+        waitForPendingDataFrameTasks();
+    }
+
+    private void createAndStartContinuousDataFrame() throws Exception {
+        createIndex(CONTINUOUS_DATA_FRAME_SOURCE);
+        long totalDocsWritten = 0;
+        for (TimeValue bucket : BUCKETS) {
+            int docs = randomIntBetween(1, 25);
+            putData(CONTINUOUS_DATA_FRAME_SOURCE, docs, bucket, ENTITIES);
+            totalDocsWritten += docs * ENTITIES.size();
+        }
+
+        DataFrameTransformConfig config = DataFrameTransformConfig.builder()
+            .setSyncConfig(new TimeSyncConfig("timestamp", TimeValue.timeValueSeconds(30)))
+            .setPivotConfig(PivotConfig.builder()
+                .setAggregations(new AggregatorFactories.Builder().addAggregator(AggregationBuilders.avg("stars").field("stars")))
+                .setGroups(GroupConfig.builder().groupBy("user_id", TermsGroupSource.builder().setField("user_id").build()).build())
+                .build())
+            .setDest(DestConfig.builder().setIndex(CONTINUOUS_DATA_FRAME_ID + "_idx").build())
+            .setSource(SourceConfig.builder().setIndex(CONTINUOUS_DATA_FRAME_SOURCE).build())
+            .setId(CONTINUOUS_DATA_FRAME_ID)
+            .build();
+        putTransform(CONTINUOUS_DATA_FRAME_ID, config);
+
+        startTransform(CONTINUOUS_DATA_FRAME_ID);
+        waitUntilAfterCheckpoint(CONTINUOUS_DATA_FRAME_ID, 0L);
+
+        DataFrameTransformStateAndStats stateAndStats = getTransformStats(CONTINUOUS_DATA_FRAME_ID);
+
+        assertThat(stateAndStats.getTransformStats().getOutputDocuments(), equalTo((long)ENTITIES.size()));
+        assertThat(stateAndStats.getTransformStats().getNumDocuments(), equalTo(totalDocsWritten));
+        assertThat(stateAndStats.getTransformState().getTaskState(), equalTo(DataFrameTransformTaskState.STARTED));
+    }
+
+    private void verifyContinuousDataFrameHandlesData(long expectedLastCheckpoint) throws Exception {
+
+        // A continuous data frame should automatically become started when it gets assigned to a node
+        // if it was assigned to the node that was removed from the cluster
+        assertBusy(() -> {
+            DataFrameTransformStateAndStats stateAndStats = getTransformStats(CONTINUOUS_DATA_FRAME_ID);
+            assertThat(stateAndStats.getTransformState().getTaskState(), equalTo(DataFrameTransformTaskState.STARTED));
+        },
+        120,
+        TimeUnit.SECONDS);
+
+        DataFrameTransformStateAndStats previousStateAndStats = getTransformStats(CONTINUOUS_DATA_FRAME_ID);
+
+        // Add a new user and write data to it
+        // This is so we can have more reliable data counts, as writing to existing entities requires
+        // rescanning the past data
+        List<String> entities = new ArrayList<>(1);
+        entities.add("user_" + ENTITIES.size() + expectedLastCheckpoint);
+        int docs = 5;
+        // Index the data very recently in the past so that the transform sync delay can catch up to reading it in our spin
+        // wait later.
+        putData(CONTINUOUS_DATA_FRAME_SOURCE, docs, TimeValue.timeValueSeconds(1), entities);
+
+        waitUntilAfterCheckpoint(CONTINUOUS_DATA_FRAME_ID, expectedLastCheckpoint);
+
+        assertBusy(() -> assertThat(
+            getTransformStats(CONTINUOUS_DATA_FRAME_ID).getTransformStats().getNumDocuments(),
+            greaterThanOrEqualTo(docs + previousStateAndStats.getTransformStats().getNumDocuments())),
+            120,
+            TimeUnit.SECONDS);
+        DataFrameTransformStateAndStats stateAndStats = getTransformStats(CONTINUOUS_DATA_FRAME_ID);
+
+        assertThat(stateAndStats.getTransformState().getTaskState(),
+            equalTo(DataFrameTransformTaskState.STARTED));
+        assertThat(stateAndStats.getTransformStats().getOutputDocuments(),
+            greaterThan(previousStateAndStats.getTransformStats().getOutputDocuments()));
+        assertThat(stateAndStats.getTransformStats().getNumDocuments(),
+            greaterThanOrEqualTo(docs + previousStateAndStats.getTransformStats().getNumDocuments()));
+    }
+
+    private void putTransform(String id, DataFrameTransformConfig config) throws IOException {
+        final Request createDataframeTransformRequest = new Request("PUT", DATAFRAME_ENDPOINT + id);
+        createDataframeTransformRequest.setJsonEntity(Strings.toString(config));
+        Response response = client().performRequest(createDataframeTransformRequest);
+        assertEquals(200, response.getStatusLine().getStatusCode());
+    }
+
+    private void deleteTransform(String id) throws IOException {
+        Response response = client().performRequest(new Request("DELETE", DATAFRAME_ENDPOINT + id));
+        assertEquals(200, response.getStatusLine().getStatusCode());
+    }
+
+    private void startTransform(String id) throws IOException  {
+        final Request startDataframeTransformRequest = new Request("POST", DATAFRAME_ENDPOINT + id + "/_start");
+        Response response = client().performRequest(startDataframeTransformRequest);
+        assertEquals(200, response.getStatusLine().getStatusCode());
+    }
+
+    private void stopTransform(String id) throws IOException  {
+        final Request stopDataframeTransformRequest = new Request("POST",
+            DATAFRAME_ENDPOINT + id + "/_stop?wait_for_completion=true");
+        Response response = client().performRequest(stopDataframeTransformRequest);
+        assertEquals(200, response.getStatusLine().getStatusCode());
+    }
+
+    private DataFrameTransformStateAndStats getTransformStats(String id) throws IOException {
+        final Request getStats = new Request("GET", DATAFRAME_ENDPOINT + id + "/_stats");
+        Response response = client().performRequest(getStats);
+        assertEquals(200, response.getStatusLine().getStatusCode());
+        XContentType xContentType = XContentType.fromMediaTypeOrFormat(response.getEntity().getContentType().getValue());
+        try (XContentParser parser = xContentType.xContent().createParser(
+            NamedXContentRegistry.EMPTY, DeprecationHandler.THROW_UNSUPPORTED_OPERATION,
+            response.getEntity().getContent())) {
+            GetDataFrameTransformStatsResponse resp = GetDataFrameTransformStatsResponse.fromXContent(parser);
+            assertThat(resp.getTransformsStateAndStats(), hasSize(1));
+            return resp.getTransformsStateAndStats().get(0);
+        }
+    }
+
+    private void waitUntilAfterCheckpoint(String id, long currentCheckpoint) throws Exception {
+        assertBusy(() -> assertThat(getTransformStats(id).getTransformState().getCheckpoint(), greaterThan(currentCheckpoint)),
+            60, TimeUnit.SECONDS);
+    }
+
+    private void createIndex(String indexName) throws IOException {
+        // create mapping
+        try (XContentBuilder builder = jsonBuilder()) {
+            builder.startObject();
+            {
+                builder.startObject("mappings")
+                    .startObject("properties")
+                    .startObject("timestamp")
+                    .field("type", "date")
+                    .endObject()
+                    .startObject("user_id")
+                    .field("type", "keyword")
+                    .endObject()
+                    .startObject("stars")
+                    .field("type", "integer")
+                    .endObject()
+                    .endObject()
+                    .endObject();
+            }
+            builder.endObject();
+            final StringEntity entity = new StringEntity(Strings.toString(builder), ContentType.APPLICATION_JSON);
+            Request req = new Request("PUT", indexName);
+            req.setEntity(entity);
+            client().performRequest(req);
+        }
+    }
+
+    private void putData(String indexName, int numDocs, TimeValue fromTime, List<String> entityIds) throws IOException {
+        long timeStamp = Instant.now().toEpochMilli() - fromTime.getMillis();
+
+        // create index
+        final StringBuilder bulk = new StringBuilder();
+        for (int i = 0; i < numDocs; i++) {
+            for (String entity : entityIds) {
+                bulk.append("{\"index\":{\"_index\":\"" + indexName + "\"}}\n")
+                    .append("{\"user_id\":\"")
+                    .append(entity)
+                    .append("\",\"stars\":")
+                    .append(randomLongBetween(0, 5))
+                    .append(",\"timestamp\":")
+                    .append(timeStamp)
+                    .append("}\n");
+            }
+        }
+        bulk.append("\r\n");
+        final Request bulkRequest = new Request("POST", "/_bulk");
+        bulkRequest.addParameter("refresh", "true");
+        bulkRequest.setJsonEntity(bulk.toString());
+        entityAsMap(client().performRequest(bulkRequest));
+    }
+}