Last updated: 2021-10-11

Checks: 7 0

Knit directory: myTidyTuesday/

This reproducible R Markdown analysis was created with workflowr (version 1.6.2). The Checks tab describes the reproducibility checks that were applied when the results were created. The Past versions tab lists the development history.

R Markdown file: up-to-date

Great! Since the R Markdown file has been committed to the Git repository, you know the exact version of the code that produced these results.

Environment: empty

Great job! The global environment was empty. Objects defined in the global environment can affect the analysis in your R Markdown file in unknown ways. For reproduciblity it’s best to always run the code in an empty environment.

Seed: set.seed(20210907)

The command set.seed(20210907) was run prior to running the code in the R Markdown file. Setting a seed ensures that any results that rely on randomness, e.g. subsampling or permutations, are reproducible.

Session information: recorded

Great job! Recording the operating system, R version, and package versions is critical for reproducibility.

Cache: none

Nice! There were no cached chunks for this analysis, so you can be confident that you successfully produced the results during this run.

File paths: relative

Great job! Using relative paths to the files within your workflowr project makes it easier to run your code on other machines.

Repository version: 2ef046e

Great! You are using Git for version control. Tracking code development and connecting the code version to the results is critical for reproducibility.

The results in this page were generated with repository version 2ef046e. See the Past versions tab to see a history of the changes made to the R Markdown and HTML files.

Note that you need to be careful to ensure that all relevant files for the analysis have been committed to Git prior to generating the results (you can use wflow_publish or wflow_git_commit). workflowr only checks the R Markdown file, but you know if there are other scripts or data files that it depends on. Below is the status of the Git repository when the results were generated:


Ignored files:
    Ignored:    .Rhistory
    Ignored:    .Rproj.user/
    Ignored:    catboost_info/
    Ignored:    data/2021-10-11/
    Ignored:    data/CNHI_Excel_Chart.xlsx
    Ignored:    data/CommunityTreemap.jpeg
    Ignored:    data/Community_Roles.jpeg
    Ignored:    data/YammerDigitalDataScienceMembership.xlsx
    Ignored:    data/accountchurn.rds
    Ignored:    data/acs_poverty.rds
    Ignored:    data/advancedaccountchurn.rds
    Ignored:    data/airbnbcatboost.rds
    Ignored:    data/australiaweather.rds
    Ignored:    data/baseballHRxgboost.rds
    Ignored:    data/baseballHRxgboost2.rds
    Ignored:    data/fmhpi.rds
    Ignored:    data/grainstocks.rds
    Ignored:    data/hike_data.rds
    Ignored:    data/nber_rs.rmd
    Ignored:    data/netflixTitles.rmd
    Ignored:    data/netflixTitles2.rds
    Ignored:    data/spotifyxgboost.rds
    Ignored:    data/spotifyxgboostadvanced.rds
    Ignored:    data/us_states.rds
    Ignored:    data/us_states_hexgrid.geojson
    Ignored:    data/weatherstats_toronto_daily.csv

Untracked files:
    Untracked:  analysis/CHN_1_sp.rds
    Untracked:  analysis/sample data for r test.xlsx
    Untracked:  code/YammerReach.R
    Untracked:  code/work list batch targets.R

Note that any generated files, e.g. HTML, png, CSS, etc., are not included in this status report because it is ok for generated content to have uncommitted changes.

These are the previous versions of the repository in which changes were made to the R Markdown (analysis/2021_07_27_sliced.Rmd) and HTML (docs/2021_07_27_sliced.html) files. If you’ve configured a remote Git repository (see ?wflow_git_remote), click on the hyperlinks in the table below to view the files as they were in that past version.

File	Version	Author	Date	Message
Rmd	2ef046e	opus1993	2021-10-11	adopt common color scheme

Season 1 Episode 9 of #SLICED features a Major League Baseball challenge to predict whether a batter’s hit results in a home run. Each row represents a unique pitch and ball in play. The evaluation metric for submissions in this competition is classification mean logloss.

SLICED is like the TV Show Chopped but for data science. The four competitors get a never-before-seen dataset and two-hours to code a solution to a prediction challenge. Contestants get points for the best model plus bonus points for data visualization, votes from the audience, and more.

The audience is invited to participate as well. This file consists of my submissions with cleanup and commentary added.

To make the best use of the resources that we have, we will explore the data set for features to select those with the most predictive power, build a random forest to confirm the recipe, and then build one or more ensemble models. If there is time, we will craft some visuals for model explainability.

Let’s load up packages:

suppressPackageStartupMessages({
library(tidyverse) # clean and transform rectangular data
library(hrbrthemes) # plot theming

library(tidymodels) # machine learning tools
library(finetune) # racing methods for accelerating hyperparameter tuning

library(themis) # ml prep tools for handling unbalanced datasets
library(baguette) # ml tools for bagged decision tree models
  
library(vip) # interpret model performance
library(DALEXtra)

})

source(here::here("code","_common.R"),
       verbose = FALSE,
       local = knitr::knit_global())

ggplot2::theme_set(theme_jim(base_size = 12))

#create a data directory
data_dir <- here::here("data",Sys.Date())
if (!file.exists(data_dir)) dir.create(data_dir)

# set a competition metric
mset <- metric_set(mn_log_loss)

# set the competition name from the web address
competition_name <- "sliced-s01e09-playoffs-1"

zipfile <- paste0(data_dir,"/", competition_name, ".zip")

path_export <- here::here("data",Sys.Date(),paste0(competition_name,".csv"))

Get the Data

A quick reminder before downloading the dataset: Go to the web site and accept the competition terms!!!

For more on other ways of predicting baseball stats, check out David Robinson’s book, Introduction to Empirical Bayes, Examples from Baseball Statistics!

We have basic shell commands available to interact with Kaggle here:

# from the Kaggle api https://github.com/Kaggle/kaggle-api

# the leaderboard
shell(glue::glue("kaggle competitions leaderboard { competition_name } -s"))

# the files to download
shell(glue::glue("kaggle competitions files -c { competition_name }"))

# the command to download files
shell(glue::glue("kaggle competitions download -c { competition_name } -p { data_dir }"))

# unzip the files received
shell(glue::glue("unzip { zipfile } -d { data_dir }"))

We are reading in the contents of the three datafiles here, unnesting the id_artists column, joining the artists table to each id of the artists, cleaning the genres text, and finally collapsing the genres back.

park_dimensions <- read_csv(file = glue::glue(
  {
    data_dir
  },
  "/park_dimensions.csv"
))

train_df <- read_csv(file = glue::glue(
  {
    data_dir
  },
  "/train.csv"
)) %>%
  left_join(park_dimensions, by = "park") %>%
  mutate(across(ends_with("_team"), as_factor)) %>%
  mutate(across(ends_with("_name"), as_factor)) %>%
  mutate(across(ends_with("_id"), as_factor)) %>%
  mutate(across(ends_with("is_"), as_factor)) %>%
  mutate(Cover = as_factor(Cover)) %>%
  mutate(bb_type = as_factor(bb_type)) %>%
  mutate(bearing = as_factor(bearing)) %>%
  select(is_home_run, everything()) %>%
  mutate(is_home_run = factor(if_else(is_home_run == 1, "yes", "no"))) %>%
  janitor::clean_names()

holdout_df <- read_csv(file = glue::glue(
  {
    data_dir
  },
  "/test.csv"
)) %>%
  left_join(park_dimensions, by = "park") %>%
  mutate(across(ends_with("_team"), as_factor)) %>%
  mutate(across(ends_with("_name"), as_factor)) %>%
  mutate(across(ends_with("_id"), as_factor)) %>%
  mutate(across(ends_with("is_"), as_factor)) %>%
  mutate(Cover = as_factor(Cover)) %>%
  mutate(bb_type = as_factor(bb_type)) %>%
  mutate(bearing = as_factor(bearing)) %>%
  janitor::clean_names()

Some questions to answer here: What features have missing data, and imputations may be required? What does the outcome variable look like, in terms of imbalance?

skimr::skim(train_df)

Outcome variable is_home_run is a binary class. bb_type, launch_speed, and launch_angle are missing some data. We will take a closer look at what missingness means in this context.

Outcome Variable Distribution

summarize_is_home_run <- function(tbl) {
  ret <- tbl %>%
    summarize(
      n_is_home_run = sum(is_home_run == "yes"),
      n = n(),
      .groups = "drop"
    ) %>%
    arrange(desc(n)) %>%
    mutate(
      pct_is_home_run = n_is_home_run / n,
      low = qbeta(.025, n_is_home_run + 5, n - n_is_home_run + .5),
      high = qbeta(.975, n_is_home_run + 5, n - n_is_home_run + .5)
    ) %>%
    mutate(pct = n / sum(n))
  ret
}

train_df %>%
  group_by(batter_team) %>%
  summarize_is_home_run() %>%
  mutate(batter_team = fct_reorder(batter_team, pct_is_home_run)) %>%
  ggplot(aes(pct_is_home_run, batter_team)) +
  geom_point(aes(size = pct)) +
  geom_errorbarh(aes(xmin = low, xmax = high), height = .3) +
  scale_size_continuous(
    labels = percent,
    guide = "none",
    range = c(.5, 4)
  ) +
  scale_x_continuous(labels = percent) +
  labs(
    x = "Proportion of at bats",
    y = "",
    title = "What teams get the most home runs?",
    subtitle = "Including 95% intervals. Size of points is proportional to at-bat frequency in the dataset"
  )

train_df %>%
  group_by(name) %>%
  summarize_is_home_run() %>%
  mutate(name = fct_reorder(name, pct_is_home_run)) %>%
  ggplot(aes(pct_is_home_run, name)) +
  geom_point(aes(size = pct)) +
  geom_errorbarh(aes(xmin = low, xmax = high), height = .3) +
  scale_size_continuous(
    labels = percent,
    guide = "none",
    range = c(.5, 4)
  ) +
  scale_x_continuous(labels = percent) +
  labs(
    x = "Proportion of at bats",
    y = "",
    title = "What ballparks get the most home runs?",
    subtitle = "Including 95% intervals. Size of points is proportional to at-bat frequency in the dataset"
  )

train_df %>%
  group_by(inning = pmin(inning, 10)) %>%
  summarize_is_home_run() %>%
  arrange(inning) %>%
  #  mutate(inning = fct_reorder(inning, -as.numeric(inning))) %>%
  ggplot(aes(pct_is_home_run, inning)) +
  geom_point(aes(size = pct), show.legend = FALSE) +
  geom_line(orientation = "y") +
  geom_ribbon(aes(xmin = low, xmax = high), alpha = .2) +
  scale_x_continuous(labels = percent) +
  scale_y_continuous(breaks = 1:10, labels = c(1:9, "10+")) +
  labs(
    x = "Proportion of at bats that are home runs",
    y = "",
    title = "What innings get the most home runs?",
    subtitle = "Including 95% intervals. Size of points is proportional to at-bat frequency in the dataset"
  ) +
  theme(
    legend.position = c(0.8, 0.8),
    legend.background = element_rect(color = "white")
  )

train_df %>%
  group_by(balls, strikes) %>%
  summarize_is_home_run() %>%
  mutate(pitch_count = paste0(strikes, "-", balls)) %>%
  ggplot(aes(pct_is_home_run, pitch_count)) +
  geom_point(aes(size = pct)) +
  geom_errorbarh(aes(xmin = low, xmax = high), height = .3) +
  scale_size_continuous(
    labels = percent,
    guide = "none",
    range = c(1, 7)
  ) +
  scale_x_continuous(labels = percent) +
  geom_text(
    data = . %>% filter(pitch_count == "2-3"),
    label = "Home runs are likely with a full count",
    check_overlap = TRUE,
    nudge_y = -0.3
  ) +
  geom_text(
    data = . %>% filter(pitch_count == "0-3"),
    label = "Home runs are likely with the batter ahead",
    check_overlap = TRUE,
    nudge_y = -0.3
  ) +
  labs(
    x = "Proportion of at bats",
    y = "Strikes - Balls",
    title = "At what levels of pitch count are there more home runs?",
    subtitle = "Including 95% intervals. Size of points is proportional to at-bat frequency in the dataset"
  )

train_df %>%
  group_by(balls, strikes) %>%
  summarize_is_home_run() %>%
  ggplot(aes(balls, strikes, fill = pct_is_home_run)) +
  geom_tile() +
  labs(
    x = "# of balls",
    y = "# of strikes",
    title = "Home runs are more likely with many balls, fewer strikes",
    fill = "% HR"
  )

train_df %>%
  group_by(balls, strikes) %>%
  summarize(
    pct_hr = mean(is_home_run == "yes"),
    avg_height = mean((plate_z), na.rm = TRUE),
    avg_abs_distance_center = mean(abs(plate_x), na.rm = TRUE),
    .groups = "drop"
  ) %>%
  mutate(count = paste0(balls, "-", strikes)) %>%
  ggplot(aes(avg_abs_distance_center,
    avg_height,
    color = pct_hr
  )) +
  geom_point(size = 5, shape = 20) +
  scale_color_viridis_b(option = "H") +
  ggrepel::geom_text_repel(aes(label = count)) +
  labs(
    x = "Average distance from center plate (feet)",
    y = "Average height (feet)",
    fill = "% home run",
    subtitle = "The count affects where a pitcher throws the ball, & therefore probability of HR"
  )

train_df %>%
  group_by(bb_type) %>%
  summarize_is_home_run() %>%
  filter(!is.na(bb_type)) %>%
  ggplot(aes(bb_type, pct_is_home_run)) +
  geom_col() +
  scale_y_continuous(labels = percent) +
  labs(
    y = "% home run",
    subtitle = "Ground balls and pop-ups are (literally) *never* home runs. Fly balls often are"
  ) +
  theme(panel.grid.major.x = element_blank())

train_df %>%
  group_by(bearing) %>%
  summarize_is_home_run() %>%
  mutate(bearing = fct_relevel(bearing, "right", "center", "left")) %>%
  ggplot(aes(pct_is_home_run, bearing)) +
  geom_point(aes(size = pct)) +
  geom_errorbarh(aes(xmin = low, xmax = high), height = .3) +
  scale_size_continuous(
    labels = percent,
    guide = "none",
    range = c(.5, 4)
  ) +
  scale_x_continuous(labels = percent) +
  labs(
    x = "Proportion of at bats",
    y = "",
    title = "What bearings get the most home runs?",
    subtitle = "Including 95% intervals. Size of points is proportional to at-bat frequency in the dataset"
  ) +
  theme(panel.grid.major.y = element_blank())

train_df %>%
  group_by(pitch_name) %>%
  summarize_is_home_run() %>%
  filter(n > 10) %>%
  mutate(pitch_name = fct_reorder(pitch_name, pct_is_home_run)) %>%
  ggplot(aes(pct_is_home_run, pitch_name)) +
  geom_point(aes(size = pct)) +
  geom_errorbarh(aes(xmin = low, xmax = high), height = .3) +
  scale_size_continuous(
    labels = percent,
    guide = "none",
    range = c(.5, 4)
  ) +
  scale_x_continuous(labels = percent) +
  labs(
    x = "Proportion of at bats",
    y = "",
    title = "What pitch names get the most home runs?",
    subtitle = "Including 95% intervals. Size of points is proportional to at-bat frequency in the dataset"
  ) +
  theme(panel.grid.major.y = element_blank())

train_df %>%
  count(is_home_run) %>%
  ggplot(aes(n, is_home_run, fill = is_home_run)) +
  geom_col(show.legend = FALSE) +
  scale_fill_viridis_d(option = "H") +
  labs(subtitle = "There are a lot more non-home runs in this dataset than home runs.
", fill = NULL, y = NULL)

Time series

train_df %>%
  group_by(week = as.Date("2020-01-01") + lubridate::week(game_date) * 7) %>%
  summarize_is_home_run() %>%
  ggplot(aes(week, pct_is_home_run)) +
  geom_point(aes(size = n)) +
  geom_line() +
  geom_ribbon(aes(ymin = low, ymax = high), alpha = .2) +
  expand_limits(y = 0) +
  scale_x_date(
    date_labels = "%b",
    date_breaks = "month",
    minor_breaks = NULL
  ) +
  scale_y_continuous(labels = percent) +
  scale_size_continuous(guide = "none") +
  labs(
    x = NULL,
    y = "% home runs",
    title = "Home Runs are more common later in the season!",
    subtitle = glue::glue("Ribbon shows 95% confidence bound by week for dataset spanning { min(train_df$game_date) } thru { max(train_df$game_date) }.")
  )

train_df %>%
  group_by(name, lf_dim, cf_dim, rf_dim, lf_w, cf_w, rf_w) %>%
  summarize_is_home_run() %>%
  pivot_longer(cols = lf_dim:rf_w, names_to = "metric", values_to = "value") %>%
  ggplot(aes(value, pct_is_home_run)) +
  geom_point() +
  geom_text(aes(label = name),
    check_overlap = TRUE,
    vjust = 1,
    hjust = 1
  ) +
  facet_wrap(~metric, scales = "free_x") +
  labs(subtitle = "No trends where a park's dimensions are statistically significant")

train_df %>%
  group_by(name, lf_dim, cf_dim, rf_dim, lf_w, cf_w, rf_w) %>%
  summarize_is_home_run() %>%
  pivot_longer(cols = lf_dim:rf_w, names_to = "metric", values_to = "value") %>%
  group_by(metric) %>%
  summarize(tidy(cor.test(value, pct_is_home_run)))

train_df %>%
  select(is_home_run, plate_x:launch_angle) %>%
  pivot_longer(cols = -is_home_run, names_to = "feature", values_to = "value") %>%
  ggplot(aes(value, fill = is_home_run)) +
  geom_density(alpha = .5) +
  scale_fill_viridis_d(option = "H") +
  facet_wrap(~feature, scales = "free") +
  labs(
    subtitle = "There's a sweet spot of launch angle & speed where home runs happen",
    fill = "Home Run"
  ) +
  theme(legend.position = c(0.8, 0.3))

train_df %>%
  group_by(
    launch_angle_bucket = round(launch_angle * 2, -1) / 2,
    launch_speed_bucket = round(launch_speed * 2, -1) / 2
  ) %>%
  summarize_is_home_run() %>%
  filter(n >= 30) %>%
  filter(complete.cases(.)) %>%
  ggplot(aes(launch_speed_bucket, launch_angle_bucket, fill = pct_is_home_run)) +
  geom_tile() +
  scale_fill_viridis_c(option = "H", labels = scales::percent) +
  labs(
    x = "Launch Speed",
    y = "Launch Angle",
    title = "There is a sweet spot of high speed + moderate angle",
    subtitle = "Rounded to the nearest 5 on each scale; no buckets shown with <30 data points",
    fill = "% HR"
  )

train_df %>%
  group_by(
    plate_x = round(plate_x, 1),
    plate_z = round(plate_z, 1)
  ) %>%
  summarize_is_home_run() %>%
  filter(n >= 30) %>%
  filter(complete.cases(.)) %>%
  ggplot(aes(plate_x, plate_z, z = pct_is_home_run)) +
  stat_summary_hex(alpha = 0.9, bins = 10) +
  scale_fill_viridis_c(option = "H", labels = scales::percent) +
  geom_vline(xintercept = 0, lty = 2) +
  labs(
    x = "Relative position from center plate (in feet)",
    y = "Distance above plate (in feet)",
    title = "The best place is center plate, about 2.5-3.5 feet up",
    subtitle = "Rounded to the nearest 5 on each scale; no buckets shown with <30 data points",
    fill = "% HR"
  )

Machine Learning: Random Forest

Let’s run models in two steps. The first is a simple, fast shallow random forest, to confirm that the model will run and observe feature importance scores. The second will use xgboost. Both use the basic recipe preprocessor for now.

The recipe

To move quickly I started with this basic recipe.

basic_rec <-
  recipe(
    is_home_run ~ bb_type +
      pitch_mph +
      launch_speed +
      launch_angle +
      plate_x +
      plate_z +
      is_batter_lefty +
      is_pitcher_lefty,
    data = train_df
  )

Dataset for modeling

basic_rec %>%
  #  finalize_recipe(list(num_comp = 2)) %>%
  prep() %>%
  juice()

Cross Validation

We will use 5-fold cross validation and stratify on the outcome to build models that are less likely to over-fit the training data.

Proper business modeling practice would holdout a sample from training entirely for assessing model performance. I’ve made an exception here for Kaggle.

set.seed(2021)

(folds <- vfold_cv(train_df, v = 5, strata = is_home_run))

Model Specification

This first model is a bagged tree, where the number of predictors to consider for each split of a tree (i.e., mtry) equals the number of all available predictors. The min_n of 10 means that each tree branch of the 50 decision trees built have at least 10 observations. As a result, the decision trees in the ensemble all are relatively shallow.

(bag_spec <-
  bag_tree(min_n = 10) %>%
  set_engine("rpart", times = 50) %>%
  set_mode("classification"))

Bagged Decision Tree Model Specification (classification)

Main Arguments:
  cost_complexity = 0
  min_n = 10

Engine-Specific Arguments:
  times = 50

Computational engine: rpart

Parallel backend

To speed up computation we will use a parallel backend.

all_cores <- parallelly::availableCores(omit = 1)
all_cores

system 
    11

future::plan("multisession", workers = all_cores) # on Windows

Fit and Variable Importance

Lets make a cursory check of the recipe and variable importance, which comes out of rpart for free. This workflow also handles factors without dummies.

bag_wf <-
  workflow() %>%
  add_recipe(basic_rec) %>%
  add_model(bag_spec)

bag_fit <- parsnip::fit(bag_wf, data = train_df)

extract_fit_parsnip(bag_fit)$fit$imp %>%
  mutate(term = fct_reorder(term, value)) %>%
  ggplot(aes(value, term)) +
  geom_point() +
  geom_errorbarh(aes(
    xmin = value - `std.error` / 2,
    xmax = value + `std.error` / 2
  ),
  height = .3
  ) +
  labs(
    title = "Feature Importance",
    x = NULL, y = NULL
  )

augment(bag_fit, train_df) %>%
  select(is_home_run, .pred_yes) %>%
  mn_log_loss(truth = is_home_run, estimate = .pred_yes, event_level = "second")

Wow, that’s not too shabby. Of course, this may have overfitted. Let’s bank this first submission to Kaggle as-is, and work more with xgboost to do better.

submission <- augment(bag_fit, holdout_df) %>%
  select(bip_id, is_home_run = .pred_yes)

write_csv(submission, file = path_export)

shell(glue::glue('kaggle competitions submit -c { competition_name } -f { path_export } -m "First model"'))

Machine Learning: XGBoost Model 1

Model Specification

Let’s start with a boosted model that runs fast and gives an early indication of which hyperparameters make the most difference in model performance.

(xgboost_spec <- boost_tree(
  trees = tune(),
  min_n = tune(),
  learn_rate = tune(),
  tree_depth = tune(),
  stop_iter = 20
) %>%
  set_engine("xgboost", validation = 0.2) %>%
  set_mode("classification"))

Boosted Tree Model Specification (classification)

Main Arguments:
  trees = tune()
  min_n = tune()
  tree_depth = tune()
  learn_rate = tune()
  stop_iter = 20

Engine-Specific Arguments:
  validation = 0.2

Computational engine: xgboost

Tuning and Performance

We will use the basic recipe from above and simply dummy the categorical predictors.

second_rec <-
  recipe(
    is_home_run ~ bb_type +
      pitch_mph +
      launch_speed +
      launch_angle +
      plate_x +
      plate_z +
      is_batter_lefty +
      is_pitcher_lefty,
    data = train_df
  ) %>%
  step_unknown(all_nominal_predictors()) %>%
  step_dummy(all_nominal_predictors()) %>%
  step_impute_linear(launch_angle, launch_speed,
    impute_with = imp_vars(plate_x, plate_z, pitch_mph)
  ) %>%
  step_nzv(all_predictors())

cv_res_xgboost <-
  workflow() %>%
  add_recipe(second_rec) %>%
  add_model(xgboost_spec) %>%
  tune_grid(
    resamples = folds,
    grid = 7,
    metrics = mset
  )

autoplot(cv_res_xgboost)

collect_metrics(cv_res_xgboost) %>%
  arrange(mean)

xgb_wf_best <-
  workflow() %>%
  add_recipe(second_rec) %>%
  add_model(xgboost_spec) %>%
  finalize_workflow(select_best(cv_res_xgboost))

fit_best <- xgb_wf_best %>%
  parsnip::fit(data = train_df)

[21:03:07] WARNING: amalgamation/../src/learner.cc:1095: Starting in XGBoost 1.3.0, the default evaluation metric used with the objective 'binary:logistic' was changed from 'error' to 'logloss'. Explicitly set eval_metric if you'd like to restore the old behavior.

augment(fit_best, train_df) %>%
  select(is_home_run, .pred_yes) %>%
  mn_log_loss(
    truth = is_home_run,
    estimate = .pred_yes,
    event_level = "second"
  )

On training data, this log loss figure is not an improvement. I am going to attempt to post this second submission to Kaggle anyway, and work more with xgboost and a more advanced recipe to do better.

submission <- augment(fit_best, holdout_df) %>%
  select(bip_id, is_home_run = .pred_yes)

write_csv(submission, file = path_export)

shell(glue::glue('kaggle competitions submit -c { competition_name } -f { path_export } -m "Second model"'))

Machine Learning: XGBoost Model 2

Let’s use what we learned above to set a more advanced recipe. This time, let’s also try thetune_race_anova technique for skipping the parts of the grid search that do not perform well.

Advanced Recipe

advanced_rec <-
  recipe(
    is_home_run ~ bb_type + pitch_mph + launch_speed + launch_angle +
      plate_x + plate_z + inning + balls + strikes +
      is_pitcher_lefty + is_batter_lefty +
      game_date + home_team + batter_team + bearing,
    data = train_df
  ) %>%
  step_date(game_date, features = "week", keep_original_cols = FALSE) %>%
  step_mutate(is_home_team = home_team == batter_team) %>%
  step_rm(home_team) %>%
  step_unknown(all_nominal_predictors()) %>%
  step_dummy(all_nominal_predictors()) %>%
  step_impute_linear(launch_angle, launch_speed,
    impute_with = imp_vars(plate_x, plate_z, pitch_mph)
  ) %>%
  step_nzv(all_predictors())

Model Specification

(xgboost_spec <- boost_tree(
  trees = tune(),
  min_n = tune(),
  mtry = tune(),
  learn_rate = 0.01
) %>%
  set_engine("xgboost") %>%
  set_mode("classification"))

Boosted Tree Model Specification (classification)

Main Arguments:
  mtry = tune()
  trees = tune()
  min_n = tune()
  learn_rate = 0.01

Computational engine: xgboost

Tuning and Performance

cv_res_xgboost <-
  workflow() %>%
  add_recipe(advanced_rec) %>%
  add_model(xgboost_spec) %>%
  tune_race_anova(
    resamples = folds,
    grid = 12,
    control = control_race(
      verbose_elim = TRUE,
      parallel_over = "resamples"
    ),
    metrics = mset
  )

We can visualize how the possible parameter combinations we tried did during the “race.” Notice how we saved a TON of time by not evaluating the parameter combinations that were clearly doing poorly on all the resamples; we only kept going with the good parameter combinations.

plot_race(cv_res_xgboost)

And we can look at the top results

autoplot(cv_res_xgboost)

show_best(cv_res_xgboost)

The best here is still discouraging. This figure is likely more robust and a better estimate of performance on holdout data. Let’s fit on the entire training set at these hyperparameters to get a single performance estimate on the best model so far.

xgb_wf_best <-
  workflow() %>%
  add_recipe(advanced_rec) %>%
  add_model(xgboost_spec) %>%
  finalize_workflow(select_best(cv_res_xgboost))

fit_best <- xgb_wf_best %>%
  parsnip::fit(data = train_df)

[21:03:32] WARNING: amalgamation/../src/learner.cc:1095: Starting in XGBoost 1.3.0, the default evaluation metric used with the objective 'binary:logistic' was changed from 'error' to 'logloss'. Explicitly set eval_metric if you'd like to restore the old behavior.

augment(fit_best, train_df) %>%
  select(is_home_run, .pred_yes) %>%
  mn_log_loss(truth = is_home_run, estimate = .pred_yes, event_level = "second")

Variable Importance

Let’s take a deeper dive into the XGBoost variable importance.

fit_best %>%
  extract_fit_parsnip() %>%
  vip(geom = "point", num_features = 15) +
  labs(
    title = "XGBoost model Variable Importance",
    subtitle = "VIP package"
  )

DALEX Partial Dependence Plots

What is the aggregated effect of the launch_angle feature over 500 examples?

explainer_xgb <- explain_tidymodels(
  fit_best,
  train_df %>% select(-is_home_run),
  as.numeric(train_df$is_home_run)
)

Preparation of a new explainer is initiated
  -> model label       :  workflow  ( [33m default [39m )
  -> data              :  46244  rows  32  cols 
  -> data              :  tibble converted into a data.frame 
  -> target variable   :  46244  values 
  -> predict function  :  yhat.workflow  will be used ( [33m default [39m )
  -> predicted values  :  No value for predict function target column. ( [33m default [39m )
  -> model_info        :  package tidymodels , ver. 0.1.4 , task classification ( [33m default [39m ) 
  -> predicted values  :  numerical, min =  6.556511e-06 , mean =  0.05292456 , max =  0.9867029  
  -> residual function :  difference between y and yhat ( [33m default [39m )
  -> residuals         :  numerical, min =  0.06649031 , mean =  0.9999904 , max =  1.985391  
 [32m A new explainer has been created! [39m

pdp_angle <- model_profile(explainer_xgb,
  N = 500,
  variables = "launch_angle"
)

as_tibble(pdp_angle$agr_profiles) %>%
  ggplot(aes(`_x_`, `_yhat_`)) +
  geom_line(
    data = as_tibble(
      pdp_angle$cp_profiles
    ),
    aes(launch_angle, group = `_ids_`),
    size = 0.5, alpha = 0.1, color = "gray30"
  ) +
  geom_line(size = 1.2, alpha = 0.8, color = "orange") +
  labs(x = "Launch Angle", y = "Predicted Home Runs")

What is the aggregated effect of the launch_speed feature over 500 examples?

pdp_speed <- model_profile(explainer_xgb,
  N = 500,
  variables = "launch_speed"
)

as_tibble(pdp_speed$agr_profiles) %>%
  ggplot(aes(`_x_`, `_yhat_`)) +
  geom_line(
    data = as_tibble(
      pdp_speed$cp_profiles
    ),
    aes(launch_speed, group = `_ids_`),
    size = 0.5, alpha = 0.1, color = "gray30"
  ) +
  geom_line(size = 1.2, alpha = 0.8, color = "darkblue") +
  labs(x = "Launch Speed", y = "Predicted Home Runs")

We’re out of time. This will be as good as it gets. Our final submission:

Let’s post this final submission to Kaggle.

submission <- augment(fit_best, holdout_df) %>%
  select(bip_id, is_home_run = .pred_yes)

write_csv(submission, file = path_export)

shell(glue::glue('kaggle competitions submit -c { competition_name } -f { path_export } -m "Final model"'))

sessionInfo()

R version 4.1.1 (2021-08-10)
Platform: x86_64-w64-mingw32/x64 (64-bit)
Running under: Windows 10 x64 (build 22000)

Matrix products: default

locale:
[1] LC_COLLATE=English_United States.1252 
[2] LC_CTYPE=English_United States.1252   
[3] LC_MONETARY=English_United States.1252
[4] LC_NUMERIC=C                          
[5] LC_TIME=English_United States.1252    

attached base packages:
[1] stats     graphics  grDevices utils     datasets  methods   base     

other attached packages:
 [1] DALEXtra_2.1.1     DALEX_2.3.0        vip_0.3.2          baguette_0.1.1    
 [5] themis_0.1.4       finetune_0.1.0     yardstick_0.0.8    workflowsets_0.1.0
 [9] workflows_0.2.3    tune_0.1.6         rsample_0.1.0      recipes_0.1.17    
[13] parsnip_0.1.7.900  modeldata_0.1.1    infer_1.0.0        dials_0.0.10      
[17] scales_1.1.1       broom_0.7.9        tidymodels_0.1.4   hrbrthemes_0.8.0  
[21] forcats_0.5.1      stringr_1.4.0      dplyr_1.0.7        purrr_0.3.4       
[25] readr_2.0.2        tidyr_1.1.4        tibble_3.1.4       ggplot2_3.3.5     
[29] tidyverse_1.3.1    workflowr_1.6.2   

loaded via a namespace (and not attached):
  [1] utf8_1.2.2         R.utils_2.11.0     reticulate_1.22   
  [4] tidyselect_1.1.1   grid_4.1.1         pROC_1.18.0       
  [7] munsell_0.5.0      codetools_0.2-18   ragg_1.1.3        
 [10] xgboost_1.4.1.1    future_1.22.1      withr_2.4.2       
 [13] colorspace_2.0-2   highr_0.9          knitr_1.36        
 [16] rstudioapi_0.13    Rttf2pt1_1.3.8     listenv_0.8.0     
 [19] labeling_0.4.2     git2r_0.28.0       TeachingDemos_2.12
 [22] farver_2.1.0       bit64_4.0.5        DiceDesign_1.9    
 [25] rprojroot_2.0.2    mlr_2.19.0         parallelly_1.28.1 
 [28] vctrs_0.3.8        generics_0.1.0     ipred_0.9-12      
 [31] xfun_0.26          R6_2.5.1           doParallel_1.0.16 
 [34] lhs_1.1.3          cachem_1.0.6       assertthat_0.2.1  
 [37] vroom_1.5.5        promises_1.2.0.1   nnet_7.3-16       
 [40] gtable_0.3.0       Cubist_0.3.0       globals_0.14.0    
 [43] timeDate_3043.102  rlang_0.4.11       BBmisc_1.11       
 [46] systemfonts_1.0.2  splines_4.1.1      butcher_0.1.5     
 [49] extrafontdb_1.0    hexbin_1.28.2      earth_5.3.1       
 [52] checkmate_2.0.0    yaml_2.2.1         reshape2_1.4.4    
 [55] modelr_0.1.8       backports_1.2.1    httpuv_1.6.3      
 [58] extrafont_0.17     usethis_2.0.1      inum_1.0-4        
 [61] tools_4.1.1        lava_1.6.10        ellipsis_0.3.2    
 [64] jquerylib_0.1.4    Rcpp_1.0.7         plyr_1.8.6        
 [67] parallelMap_1.5.1  rpart_4.1-15       ParamHelpers_1.14 
 [70] viridis_0.6.1      ggrepel_0.9.1      haven_2.4.3       
 [73] fs_1.5.0           here_1.0.1         furrr_0.2.3       
 [76] unbalanced_2.0     magrittr_2.0.1     data.table_1.14.2 
 [79] reprex_2.0.1       RANN_2.6.1         GPfit_1.0-8       
 [82] mvtnorm_1.1-2      whisker_0.4        R.cache_0.15.0    
 [85] ROSE_0.0-4         hms_1.1.1          evaluate_0.14     
 [88] readxl_1.3.1       gridExtra_2.3      shape_1.4.6       
 [91] compiler_4.1.1     ingredients_2.2.0  crayon_1.4.1      
 [94] R.oo_1.24.0        htmltools_0.5.2    later_1.3.0       
 [97] tzdb_0.1.2         Formula_1.2-4      libcoin_1.0-9     
[100] lubridate_1.7.10   DBI_1.1.1          dbplyr_2.1.1      
[103] MASS_7.3-54        rappdirs_0.3.3     Matrix_1.3-4      
[106] cli_3.0.1          C50_0.1.5          R.methodsS3_1.8.1 
[109] parallel_4.1.1     gower_0.2.2        pkgconfig_2.0.3   
[112] xml2_1.3.2         foreach_1.5.1      bslib_0.3.0       
[115] hardhat_0.1.6      plotmo_3.6.1       prodlim_2019.11.13
[118] rvest_1.0.1        snakecase_0.11.0   digest_0.6.28     
[121] janitor_2.1.0      rmarkdown_2.11     cellranger_1.1.0  
[124] fastmatch_1.1-3    gdtools_0.2.3      lifecycle_1.0.1   
[127] jsonlite_1.7.2     viridisLite_0.4.0  lime_0.5.2        
[130] fansi_0.5.0        pillar_1.6.3       lattice_0.20-44   
[133] fastmap_1.1.0      httr_1.4.2         plotrix_3.8-2     
[136] survival_3.2-11    glue_1.4.2         conflicted_1.0.4  
[139] FNN_1.1.3          png_0.1-7          iterators_1.0.13  
[142] bit_4.0.4          glmnet_4.1-2       class_7.3-19      
[145] stringi_1.7.5      sass_0.4.0         rematch2_2.1.2    
[148] textshaping_0.3.5  partykit_1.2-15    styler_1.6.2      
[151] future.apply_1.8.1

LS0tDQp0aXRsZTogIlNsaWNlZCBCYXNlYmFsbCBIb21lIFJ1bnMiDQphdXRob3I6ICJKaW0gR3J1bWFuIg0KZGF0ZTogIkp1bHkgMjcsIDIwMjEiDQpvdXRwdXQ6DQogIHdvcmtmbG93cjo6d2Zsb3dfaHRtbDoNCiAgICB0b2M6IG5vDQogICAgY29kZV9mb2xkaW5nOiBoaWRlDQogICAgY29kZV9kb3dubG9hZDogdHJ1ZQ0KICAgIGRmX3ByaW50OiBwYWdlZA0KZWRpdG9yX29wdGlvbnM6DQogIGNodW5rX291dHB1dF90eXBlOiBjb25zb2xlDQotLS0NCg0KW1NlYXNvbiAxIEVwaXNvZGUgOV0oaHR0cHM6Ly93d3cua2FnZ2xlLmNvbS9jL3NsaWNlZC1zMDFlMDktcGxheW9mZnMtMS9kYXRhKSBvZiAjU0xJQ0VEIGZlYXR1cmVzIGEgTWFqb3IgTGVhZ3VlIEJhc2ViYWxsIGNoYWxsZW5nZSB0byBwcmVkaWN0IHdoZXRoZXIgYSBiYXR0ZXIncyBoaXQgcmVzdWx0cyBpbiBhIGhvbWUgcnVuLiBFYWNoIHJvdyByZXByZXNlbnRzIGEgdW5pcXVlIHBpdGNoIGFuZCBiYWxsIGluIHBsYXkuIFRoZSBldmFsdWF0aW9uIG1ldHJpYyBmb3Igc3VibWlzc2lvbnMgaW4gdGhpcyBjb21wZXRpdGlvbiBpcyBjbGFzc2lmaWNhdGlvbiBtZWFuIGBsb2dsb3NzYC4NCg0KIVtdKGh0dHBzOi8vd3d3Lm5vdGlvbi5zby9pbWFnZS9odHRwcyUzQSUyRiUyRnMzLXVzLXdlc3QtMi5hbWF6b25hd3MuY29tJTJGc2VjdXJlLm5vdGlvbi1zdGF0aWMuY29tJTJGN2Y3YmE1ZjktZDdiZC00MTAxLTg5MzMtYTExMmI0Zjc4NTcwJTJGRnJhbWVfMy5wbmc/dGFibGU9YmxvY2smaWQ9YzdiZDI2MzUtNmUzYS00MjI3LTllMmQtZmJhZmIwNDgwMDczJnNwYWNlSWQ9MmNjNDA0ZTYtZmUyMC00ODNkLTllYTUtNWQ0NGViM2RkNTg2JndpZHRoPTE1MTAmdXNlcklkPSZjYWNoZT12MikNCg0KW1NMSUNFRF0oaHR0cHM6Ly93d3cubm90aW9uLnNvL1NMSUNFRC1TaG93LWM3YmQyNjM1NmUzYTQyMjc5ZTJkZmJhZmIwNDgwMDczKSBpcyBsaWtlIHRoZSBUViBTaG93IENob3BwZWQgYnV0IGZvciBkYXRhIHNjaWVuY2UuIFRoZSBmb3VyIGNvbXBldGl0b3JzIGdldCBhIG5ldmVyLWJlZm9yZS1zZWVuIGRhdGFzZXQgYW5kIHR3by1ob3VycyB0byBjb2RlIGEgc29sdXRpb24gdG8gYSBwcmVkaWN0aW9uIGNoYWxsZW5nZS4gQ29udGVzdGFudHMgZ2V0IHBvaW50cyBmb3IgdGhlIGJlc3QgbW9kZWwgcGx1cyBib251cyBwb2ludHMgZm9yIGRhdGEgdmlzdWFsaXphdGlvbiwgdm90ZXMgZnJvbSB0aGUgYXVkaWVuY2UsIGFuZCBtb3JlLg0KDQpUaGUgYXVkaWVuY2UgaXMgaW52aXRlZCB0byBwYXJ0aWNpcGF0ZSBhcyB3ZWxsLiBUaGlzIGZpbGUgY29uc2lzdHMgb2YgbXkgc3VibWlzc2lvbnMgd2l0aCBjbGVhbnVwIGFuZCBjb21tZW50YXJ5IGFkZGVkLg0KDQpUbyBtYWtlIHRoZSBiZXN0IHVzZSBvZiB0aGUgcmVzb3VyY2VzIHRoYXQgd2UgaGF2ZSwgd2Ugd2lsbCBleHBsb3JlIHRoZSBkYXRhIHNldCBmb3IgZmVhdHVyZXMgdG8gc2VsZWN0IHRob3NlIHdpdGggdGhlIG1vc3QgcHJlZGljdGl2ZSBwb3dlciwgYnVpbGQgYSByYW5kb20gZm9yZXN0IHRvIGNvbmZpcm0gdGhlIHJlY2lwZSwgYW5kIHRoZW4gYnVpbGQgb25lIG9yIG1vcmUgZW5zZW1ibGUgbW9kZWxzLiBJZiB0aGVyZSBpcyB0aW1lLCB3ZSB3aWxsIGNyYWZ0IHNvbWUgdmlzdWFscyBmb3IgbW9kZWwgZXhwbGFpbmFiaWxpdHkuDQoNCkxldCdzIGxvYWQgdXAgcGFja2FnZXM6DQoNCmBgYHtyIHNldHVwfQ0KDQpzdXBwcmVzc1BhY2thZ2VTdGFydHVwTWVzc2FnZXMoew0KbGlicmFyeSh0aWR5dmVyc2UpICMgY2xlYW4gYW5kIHRyYW5zZm9ybSByZWN0YW5ndWxhciBkYXRhDQpsaWJyYXJ5KGhyYnJ0aGVtZXMpICMgcGxvdCB0aGVtaW5nDQoNCmxpYnJhcnkodGlkeW1vZGVscykgIyBtYWNoaW5lIGxlYXJuaW5nIHRvb2xzDQpsaWJyYXJ5KGZpbmV0dW5lKSAjIHJhY2luZyBtZXRob2RzIGZvciBhY2NlbGVyYXRpbmcgaHlwZXJwYXJhbWV0ZXIgdHVuaW5nDQoNCmxpYnJhcnkodGhlbWlzKSAjIG1sIHByZXAgdG9vbHMgZm9yIGhhbmRsaW5nIHVuYmFsYW5jZWQgZGF0YXNldHMNCmxpYnJhcnkoYmFndWV0dGUpICMgbWwgdG9vbHMgZm9yIGJhZ2dlZCBkZWNpc2lvbiB0cmVlIG1vZGVscw0KICANCmxpYnJhcnkodmlwKSAjIGludGVycHJldCBtb2RlbCBwZXJmb3JtYW5jZQ0KbGlicmFyeShEQUxFWHRyYSkNCg0KfSkNCg0Kc291cmNlKGhlcmU6OmhlcmUoImNvZGUiLCJfY29tbW9uLlIiKSwNCiAgICAgICB2ZXJib3NlID0gRkFMU0UsDQogICAgICAgbG9jYWwgPSBrbml0cjo6a25pdF9nbG9iYWwoKSkNCg0KZ2dwbG90Mjo6dGhlbWVfc2V0KHRoZW1lX2ppbShiYXNlX3NpemUgPSAxMikpDQoNCiNjcmVhdGUgYSBkYXRhIGRpcmVjdG9yeQ0KZGF0YV9kaXIgPC0gaGVyZTo6aGVyZSgiZGF0YSIsU3lzLkRhdGUoKSkNCmlmICghZmlsZS5leGlzdHMoZGF0YV9kaXIpKSBkaXIuY3JlYXRlKGRhdGFfZGlyKQ0KDQojIHNldCBhIGNvbXBldGl0aW9uIG1ldHJpYw0KbXNldCA8LSBtZXRyaWNfc2V0KG1uX2xvZ19sb3NzKQ0KDQojIHNldCB0aGUgY29tcGV0aXRpb24gbmFtZSBmcm9tIHRoZSB3ZWIgYWRkcmVzcw0KY29tcGV0aXRpb25fbmFtZSA8LSAic2xpY2VkLXMwMWUwOS1wbGF5b2Zmcy0xIg0KDQp6aXBmaWxlIDwtIHBhc3RlMChkYXRhX2RpciwiLyIsIGNvbXBldGl0aW9uX25hbWUsICIuemlwIikNCg0KcGF0aF9leHBvcnQgPC0gaGVyZTo6aGVyZSgiZGF0YSIsU3lzLkRhdGUoKSxwYXN0ZTAoY29tcGV0aXRpb25fbmFtZSwiLmNzdiIpKQ0KYGBgDQoNCiMjIEdldCB0aGUgRGF0YQ0KDQpBIHF1aWNrIHJlbWluZGVyIGJlZm9yZSBkb3dubG9hZGluZyB0aGUgZGF0YXNldDogIEdvIHRvIHRoZSB3ZWIgc2l0ZSBhbmQgYWNjZXB0IHRoZSBjb21wZXRpdGlvbiB0ZXJtcyEhIQ0KDQpGb3IgbW9yZSBvbiBvdGhlciB3YXlzIG9mIHByZWRpY3RpbmcgYmFzZWJhbGwgc3RhdHMsIGNoZWNrIG91dCBEYXZpZCBSb2JpbnNvbidzIGJvb2ssIFtJbnRyb2R1Y3Rpb24gdG8gRW1waXJpY2FsIEJheWVzLCBFeGFtcGxlcyBmcm9tIEJhc2ViYWxsIFN0YXRpc3RpY3MhXShodHRwczovL3d3dy5hbWF6b24uY29tL0ludHJvZHVjdGlvbi1FbXBpcmljYWwtQmF5ZXMtRXhhbXBsZXMtU3RhdGlzdGljcy1lYm9vay9kcC9CMDZXUDI2SjhRKQ0KDQpXZSBoYXZlIGJhc2ljIHNoZWxsIGNvbW1hbmRzIGF2YWlsYWJsZSB0byBpbnRlcmFjdCB3aXRoIEthZ2dsZSBoZXJlOg0KDQpgYGB7ciBrYWdnbGUgY29tcGV0aXRpb25zIHRlcm1pbmFsIGNvbW1hbmRzLCBldmFsPUZBTFNFfQ0KIyBmcm9tIHRoZSBLYWdnbGUgYXBpIGh0dHBzOi8vZ2l0aHViLmNvbS9LYWdnbGUva2FnZ2xlLWFwaQ0KDQojIHRoZSBsZWFkZXJib2FyZA0Kc2hlbGwoZ2x1ZTo6Z2x1ZSgna2FnZ2xlIGNvbXBldGl0aW9ucyBsZWFkZXJib2FyZCB7IGNvbXBldGl0aW9uX25hbWUgfSAtcycpKQ0KDQojIHRoZSBmaWxlcyB0byBkb3dubG9hZA0Kc2hlbGwoZ2x1ZTo6Z2x1ZSgna2FnZ2xlIGNvbXBldGl0aW9ucyBmaWxlcyAtYyB7IGNvbXBldGl0aW9uX25hbWUgfScpKQ0KDQojIHRoZSBjb21tYW5kIHRvIGRvd25sb2FkIGZpbGVzDQpzaGVsbChnbHVlOjpnbHVlKCdrYWdnbGUgY29tcGV0aXRpb25zIGRvd25sb2FkIC1jIHsgY29tcGV0aXRpb25fbmFtZSB9IC1wIHsgZGF0YV9kaXIgfScpKQ0KDQojIHVuemlwIHRoZSBmaWxlcyByZWNlaXZlZA0Kc2hlbGwoZ2x1ZTo6Z2x1ZSgndW56aXAgeyB6aXBmaWxlIH0gLWQgeyBkYXRhX2RpciB9JykpDQoNCmBgYA0KDQpXZSBhcmUgcmVhZGluZyBpbiB0aGUgY29udGVudHMgb2YgdGhlIHRocmVlIGRhdGFmaWxlcyBoZXJlLCB1bm5lc3RpbmcgdGhlIGlkX2FydGlzdHMgY29sdW1uLCBqb2luaW5nIHRoZSBhcnRpc3RzIHRhYmxlIHRvIGVhY2ggaWQgb2YgdGhlIGFydGlzdHMsIGNsZWFuaW5nIHRoZSBnZW5yZXMgdGV4dCwgYW5kIGZpbmFsbHkgY29sbGFwc2luZyB0aGUgZ2VucmVzIGJhY2suDQoNCmBgYHtyIHJlYWQga2FnZ2xlIGZpbGVzfQ0KDQpwYXJrX2RpbWVuc2lvbnMgPC0gcmVhZF9jc3YoZmlsZSA9IGdsdWU6OmdsdWUoeyBkYXRhX2RpciB9LCAiL3BhcmtfZGltZW5zaW9ucy5jc3YiKSkgDQoNCnRyYWluX2RmIDwtIHJlYWRfY3N2KGZpbGUgPSBnbHVlOjpnbHVlKHsgZGF0YV9kaXIgfSwgIi90cmFpbi5jc3YiKSkgJT4lIA0KICBsZWZ0X2pvaW4ocGFya19kaW1lbnNpb25zLCBieSA9ICJwYXJrIikgJT4lIA0KICBtdXRhdGUoYWNyb3NzKGVuZHNfd2l0aCgiX3RlYW0iKSwgYXNfZmFjdG9yKSkgJT4lIA0KICBtdXRhdGUoYWNyb3NzKGVuZHNfd2l0aCgiX25hbWUiKSwgYXNfZmFjdG9yKSkgJT4lIA0KICBtdXRhdGUoYWNyb3NzKGVuZHNfd2l0aCgiX2lkIiksIGFzX2ZhY3RvcikpICU+JSANCiAgbXV0YXRlKGFjcm9zcyhlbmRzX3dpdGgoImlzXyIpLCBhc19mYWN0b3IpKSAlPiUgDQogIG11dGF0ZShDb3ZlciA9IGFzX2ZhY3RvcihDb3ZlcikpICU+JSANCiAgbXV0YXRlKGJiX3R5cGUgPSBhc19mYWN0b3IoYmJfdHlwZSkpICU+JSANCiAgbXV0YXRlKGJlYXJpbmcgPSBhc19mYWN0b3IoYmVhcmluZykpICU+JSANCiAgc2VsZWN0KGlzX2hvbWVfcnVuLCBldmVyeXRoaW5nKCkpICU+JSANCiAgbXV0YXRlKGlzX2hvbWVfcnVuID0gZmFjdG9yKGlmX2Vsc2UoaXNfaG9tZV9ydW4gPT0gMSwgInllcyIsICJubyIpKSkgJT4lDQogIGphbml0b3I6OmNsZWFuX25hbWVzKCkNCg0KaG9sZG91dF9kZiA8LSByZWFkX2NzdihmaWxlID0gZ2x1ZTo6Z2x1ZSh7IGRhdGFfZGlyIH0sICIvdGVzdC5jc3YiKSkgJT4lIA0KICBsZWZ0X2pvaW4ocGFya19kaW1lbnNpb25zLCBieSA9ICJwYXJrIikgJT4lIA0KICBtdXRhdGUoYWNyb3NzKGVuZHNfd2l0aCgiX3RlYW0iKSwgYXNfZmFjdG9yKSkgJT4lIA0KICBtdXRhdGUoYWNyb3NzKGVuZHNfd2l0aCgiX25hbWUiKSwgYXNfZmFjdG9yKSkgJT4lIA0KICBtdXRhdGUoYWNyb3NzKGVuZHNfd2l0aCgiX2lkIiksIGFzX2ZhY3RvcikpICU+JSANCiAgbXV0YXRlKGFjcm9zcyhlbmRzX3dpdGgoImlzXyIpLCBhc19mYWN0b3IpKSAlPiUgDQogIG11dGF0ZShDb3ZlciA9IGFzX2ZhY3RvcihDb3ZlcikpICU+JSANCiAgbXV0YXRlKGJiX3R5cGUgPSBhc19mYWN0b3IoYmJfdHlwZSkpICU+JSANCiAgbXV0YXRlKGJlYXJpbmcgPSBhc19mYWN0b3IoYmVhcmluZykpICU+JQ0KICBqYW5pdG9yOjpjbGVhbl9uYW1lcygpDQpgYGANCg0KU29tZSBxdWVzdGlvbnMgdG8gYW5zd2VyIGhlcmU6DQpXaGF0IGZlYXR1cmVzIGhhdmUgbWlzc2luZyBkYXRhLCBhbmQgaW1wdXRhdGlvbnMgbWF5IGJlIHJlcXVpcmVkPw0KV2hhdCBkb2VzIHRoZSBvdXRjb21lIHZhcmlhYmxlIGxvb2sgbGlrZSwgaW4gdGVybXMgb2YgaW1iYWxhbmNlPw0KDQpgYGB7ciBza2ltLCBldmFsID0gRkFMU0V9DQpza2ltcjo6c2tpbSh0cmFpbl9kZikNCmBgYA0KDQpPdXRjb21lIHZhcmlhYmxlIGBpc19ob21lX3J1bmAgaXMgYSBiaW5hcnkgY2xhc3MuIGBiYl90eXBlYCwgYGxhdW5jaF9zcGVlZGAsIGFuZCBgbGF1bmNoX2FuZ2xlYCBhcmUgbWlzc2luZyBzb21lIGRhdGEuIFdlIHdpbGwgdGFrZSBhIGNsb3NlciBsb29rIGF0IHdoYXQgbWlzc2luZ25lc3MgbWVhbnMgaW4gdGhpcyBjb250ZXh0Lg0KDQojIyBPdXRjb21lIFZhcmlhYmxlIERpc3RyaWJ1dGlvbg0KDQpgYGB7ciBzdW1tYXJpemUgb3V0Y29tZX0NCnN1bW1hcml6ZV9pc19ob21lX3J1biA8LSBmdW5jdGlvbih0Ymwpew0KICByZXQgPC0gdGJsICU+JQ0KICAgIHN1bW1hcml6ZSgNCiAgICAgIG5faXNfaG9tZV9ydW4gPSBzdW0oaXNfaG9tZV9ydW4gPT0gInllcyIpLA0KICAgICAgbiA9IG4oKSwNCiAgICAgIC5ncm91cHMgPSAiZHJvcCINCiAgICApICU+JQ0KICAgIGFycmFuZ2UoZGVzYyhuKSkgJT4lDQogICAgbXV0YXRlKA0KICAgICAgcGN0X2lzX2hvbWVfcnVuID0gbl9pc19ob21lX3J1biAvIG4sDQogICAgICBsb3cgPSBxYmV0YSguMDI1LCBuX2lzX2hvbWVfcnVuICsgNSwgbiAtIG5faXNfaG9tZV9ydW4gKyAuNSksDQogICAgICBoaWdoID0gcWJldGEoLjk3NSwgbl9pc19ob21lX3J1biArIDUsIG4gLSBuX2lzX2hvbWVfcnVuICsgLjUpDQogICAgKSAlPiUNCiAgICBtdXRhdGUocGN0ID0gbiAvIHN1bShuKSkNCiAgcmV0DQp9DQoNCmBgYA0KDQpgYGB7ciwgZmlnLmFzcD0xfQ0KdHJhaW5fZGYgJT4lDQogIGdyb3VwX2J5KGJhdHRlcl90ZWFtKSAlPiUNCiAgc3VtbWFyaXplX2lzX2hvbWVfcnVuKCkgJT4lIA0KICBtdXRhdGUoYmF0dGVyX3RlYW0gPSBmY3RfcmVvcmRlcihiYXR0ZXJfdGVhbSwgcGN0X2lzX2hvbWVfcnVuKSkgJT4lDQogIGdncGxvdChhZXMocGN0X2lzX2hvbWVfcnVuLCBiYXR0ZXJfdGVhbSkpICsNCiAgZ2VvbV9wb2ludChhZXMoc2l6ZSA9IHBjdCkpICsNCiAgZ2VvbV9lcnJvcmJhcmgoYWVzKHhtaW4gPSBsb3csIHhtYXggPSBoaWdoKSwgaGVpZ2h0ID0gLjMpICsNCiAgc2NhbGVfc2l6ZV9jb250aW51b3VzKGxhYmVscyA9IHBlcmNlbnQsDQogICAgICAgICAgICAgICAgICAgICAgICBndWlkZSA9ICJub25lIiwNCiAgICAgICAgICAgICAgICAgICAgICAgIHJhbmdlID0gYyguNSwgNCkpICsNCiAgc2NhbGVfeF9jb250aW51b3VzKGxhYmVscyA9IHBlcmNlbnQpICsNCiAgbGFicygNCiAgICB4ID0gIlByb3BvcnRpb24gb2YgYXQgYmF0cyIsDQogICAgeSA9ICIiLA0KICAgIHRpdGxlID0gIldoYXQgdGVhbXMgZ2V0IHRoZSBtb3N0IGhvbWUgcnVucz8iLA0KICAgIHN1YnRpdGxlID0gIkluY2x1ZGluZyA5NSUgaW50ZXJ2YWxzLiBTaXplIG9mIHBvaW50cyBpcyBwcm9wb3J0aW9uYWwgdG8gYXQtYmF0IGZyZXF1ZW5jeSBpbiB0aGUgZGF0YXNldCINCiAgKQ0KDQp0cmFpbl9kZiAlPiUNCiAgZ3JvdXBfYnkobmFtZSApICU+JQ0KICBzdW1tYXJpemVfaXNfaG9tZV9ydW4oKSAlPiUgDQogIG11dGF0ZShuYW1lID0gZmN0X3Jlb3JkZXIobmFtZSwgcGN0X2lzX2hvbWVfcnVuKSkgJT4lDQogIGdncGxvdChhZXMocGN0X2lzX2hvbWVfcnVuLCBuYW1lKSkgKw0KICBnZW9tX3BvaW50KGFlcyhzaXplID0gcGN0KSkgKw0KICBnZW9tX2Vycm9yYmFyaChhZXMoeG1pbiA9IGxvdywgeG1heCA9IGhpZ2gpLCBoZWlnaHQgPSAuMykgKw0KICBzY2FsZV9zaXplX2NvbnRpbnVvdXMobGFiZWxzID0gcGVyY2VudCwNCiAgICAgICAgICAgICAgICAgICAgICAgIGd1aWRlID0gIm5vbmUiLA0KICAgICAgICAgICAgICAgICAgICAgICAgcmFuZ2UgPSBjKC41LCA0KSkgKw0KICBzY2FsZV94X2NvbnRpbnVvdXMobGFiZWxzID0gcGVyY2VudCkgKw0KICBsYWJzKA0KICAgIHggPSAiUHJvcG9ydGlvbiBvZiBhdCBiYXRzIiwNCiAgICB5ID0gIiIsDQogICAgdGl0bGUgPSAiV2hhdCBiYWxscGFya3MgZ2V0IHRoZSBtb3N0IGhvbWUgcnVucz8iLA0KICAgIHN1YnRpdGxlID0gIkluY2x1ZGluZyA5NSUgaW50ZXJ2YWxzLiBTaXplIG9mIHBvaW50cyBpcyBwcm9wb3J0aW9uYWwgdG8gYXQtYmF0IGZyZXF1ZW5jeSBpbiB0aGUgZGF0YXNldCINCiAgKQ0KDQp0cmFpbl9kZiAlPiUNCiAgZ3JvdXBfYnkoaW5uaW5nID0gcG1pbihpbm5pbmcsIDEwKSkgJT4lDQogIHN1bW1hcml6ZV9pc19ob21lX3J1bigpICU+JSANCiAgYXJyYW5nZShpbm5pbmcpICU+JSANCiMgIG11dGF0ZShpbm5pbmcgPSBmY3RfcmVvcmRlcihpbm5pbmcsIC1hcy5udW1lcmljKGlubmluZykpKSAlPiUgDQogIGdncGxvdChhZXMocGN0X2lzX2hvbWVfcnVuLCBpbm5pbmcpKSArDQogIGdlb21fcG9pbnQoYWVzKHNpemUgPSBwY3QpLCBzaG93LmxlZ2VuZCA9IEZBTFNFKSArDQogIGdlb21fbGluZShvcmllbnRhdGlvbiA9ICJ5IikgKw0KICBnZW9tX3JpYmJvbihhZXMoeG1pbiA9IGxvdywgeG1heCA9IGhpZ2gpLCBhbHBoYSA9IC4yKSArDQogIHNjYWxlX3hfY29udGludW91cyhsYWJlbHMgPSBwZXJjZW50KSArDQogIHNjYWxlX3lfY29udGludW91cyhicmVha3MgPSAxOjEwLCBsYWJlbHMgPSBjKDE6OSwgIjEwKyIpKSArDQogIGxhYnMoDQogICAgeCA9ICJQcm9wb3J0aW9uIG9mIGF0IGJhdHMgdGhhdCBhcmUgaG9tZSBydW5zIiwNCiAgICB5ID0gIiIsDQogICAgdGl0bGUgPSAiV2hhdCBpbm5pbmdzIGdldCB0aGUgbW9zdCBob21lIHJ1bnM/IiwNCiAgICBzdWJ0aXRsZSA9ICJJbmNsdWRpbmcgOTUlIGludGVydmFscy4gU2l6ZSBvZiBwb2ludHMgaXMgcHJvcG9ydGlvbmFsIHRvIGF0LWJhdCBmcmVxdWVuY3kgaW4gdGhlIGRhdGFzZXQiDQogICkgKw0KICB0aGVtZShsZWdlbmQucG9zaXRpb24gPSBjKDAuOCwgMC44KSwNCiAgICAgICAgbGVnZW5kLmJhY2tncm91bmQgPSBlbGVtZW50X3JlY3QoY29sb3IgPSAid2hpdGUiKSkNCg0KdHJhaW5fZGYgJT4lDQogIGdyb3VwX2J5KGJhbGxzLCBzdHJpa2VzICkgJT4lDQogIHN1bW1hcml6ZV9pc19ob21lX3J1bigpICU+JSANCiAgbXV0YXRlKHBpdGNoX2NvdW50ID0gcGFzdGUwKHN0cmlrZXMsICItIixiYWxscykpICU+JSANCiAgZ2dwbG90KGFlcyhwY3RfaXNfaG9tZV9ydW4sIHBpdGNoX2NvdW50KSkgKw0KICBnZW9tX3BvaW50KGFlcyhzaXplID0gcGN0KSkgKw0KICBnZW9tX2Vycm9yYmFyaChhZXMoeG1pbiA9IGxvdywgeG1heCA9IGhpZ2gpLCBoZWlnaHQgPSAuMykgKw0KICBzY2FsZV9zaXplX2NvbnRpbnVvdXMobGFiZWxzID0gcGVyY2VudCwNCiAgICAgICAgICAgICAgICAgICAgICAgIGd1aWRlID0gIm5vbmUiLA0KICAgICAgICAgICAgICAgICAgICAgICAgcmFuZ2UgPSBjKDEsIDcpKSArDQogIHNjYWxlX3hfY29udGludW91cyhsYWJlbHMgPSBwZXJjZW50KSArDQogIGdlb21fdGV4dChkYXRhID0gLiAlPiUgZmlsdGVyKHBpdGNoX2NvdW50ID09ICIyLTMiKSwNCiAgICAgICAgICAgIGxhYmVsID0gIkhvbWUgcnVucyBhcmUgbGlrZWx5IHdpdGggYSBmdWxsIGNvdW50IiwNCiAgICAgICAgICAgIGNoZWNrX292ZXJsYXAgPSBUUlVFLA0KICAgICAgICAgICAgbnVkZ2VfeSA9IC0wLjMpICsNCiAgICBnZW9tX3RleHQoZGF0YSA9IC4gJT4lIGZpbHRlcihwaXRjaF9jb3VudCA9PSAiMC0zIiksDQogICAgICAgICAgICBsYWJlbCA9ICJIb21lIHJ1bnMgYXJlIGxpa2VseSB3aXRoIHRoZSBiYXR0ZXIgYWhlYWQiLA0KICAgICAgICAgICAgY2hlY2tfb3ZlcmxhcCA9IFRSVUUsDQogICAgICAgICAgICBudWRnZV95ID0gLTAuMykgKw0KICBsYWJzKA0KICAgIHggPSAiUHJvcG9ydGlvbiBvZiBhdCBiYXRzIiwNCiAgICB5ID0gIlN0cmlrZXMgLSBCYWxscyIsDQogICAgdGl0bGUgPSAiQXQgd2hhdCBsZXZlbHMgb2YgcGl0Y2ggY291bnQgYXJlIHRoZXJlIG1vcmUgaG9tZSBydW5zPyIsDQogICAgc3VidGl0bGUgPSAiSW5jbHVkaW5nIDk1JSBpbnRlcnZhbHMuIFNpemUgb2YgcG9pbnRzIGlzIHByb3BvcnRpb25hbCB0byBhdC1iYXQgZnJlcXVlbmN5IGluIHRoZSBkYXRhc2V0Ig0KICApDQoNCnRyYWluX2RmICU+JQ0KICBncm91cF9ieShiYWxscywgc3RyaWtlcykgJT4lDQogIHN1bW1hcml6ZV9pc19ob21lX3J1bigpICU+JQ0KICBnZ3Bsb3QoYWVzKGJhbGxzLCBzdHJpa2VzLCBmaWxsID0gcGN0X2lzX2hvbWVfcnVuKSkgKw0KICBnZW9tX3RpbGUoKSArDQogIGxhYnMoeCA9ICIjIG9mIGJhbGxzIiwNCiAgICAgICB5ID0gIiMgb2Ygc3RyaWtlcyIsDQogICAgICAgdGl0bGUgPSAnSG9tZSBydW5zIGFyZSBtb3JlIGxpa2VseSB3aXRoIG1hbnkgYmFsbHMsIGZld2VyIHN0cmlrZXMnLA0KICAgICAgIGZpbGwgPSAiJSBIUiIpDQoNCnRyYWluX2RmICU+JQ0KICBncm91cF9ieShiYWxscywgc3RyaWtlcykgJT4lDQogIHN1bW1hcml6ZShwY3RfaHIgPSBtZWFuKGlzX2hvbWVfcnVuID09ICJ5ZXMiKSwNCiAgICAgICAgICAgIGF2Z19oZWlnaHQgPSBtZWFuKChwbGF0ZV96KSwgbmEucm0gPSBUUlVFKSwNCiAgICAgICAgICAgIGF2Z19hYnNfZGlzdGFuY2VfY2VudGVyID0gbWVhbihhYnMocGxhdGVfeCksIG5hLnJtID0gVFJVRSksDQogICAgICAgICAgICAuZ3JvdXBzID0gImRyb3AiKSAlPiUNCiAgbXV0YXRlKGNvdW50ID0gcGFzdGUwKGJhbGxzLCAiLSIsIHN0cmlrZXMpKSAlPiUNCiAgZ2dwbG90KGFlcyhhdmdfYWJzX2Rpc3RhbmNlX2NlbnRlciwgDQogICAgICAgICAgICAgYXZnX2hlaWdodCwgDQogICAgICAgICAgICAgY29sb3IgPSBwY3RfaHIpKSArDQogIGdlb21fcG9pbnQoc2l6ZSA9IDUsIHNoYXBlID0gMjApICsNCiAgc2NhbGVfY29sb3JfdmlyaWRpc19iKG9wdGlvbiA9ICJIIikgKyAgDQogIGdncmVwZWw6Omdlb21fdGV4dF9yZXBlbChhZXMobGFiZWwgPSBjb3VudCkpICsNCiAgbGFicyh4ID0gIkF2ZXJhZ2UgZGlzdGFuY2UgZnJvbSBjZW50ZXIgcGxhdGUgKGZlZXQpIiwNCiAgICAgICB5ID0gIkF2ZXJhZ2UgaGVpZ2h0IChmZWV0KSIsDQogICAgICAgZmlsbCA9ICIlIGhvbWUgcnVuIiwNCiAgICAgICBzdWJ0aXRsZSA9ICJUaGUgY291bnQgYWZmZWN0cyB3aGVyZSBhIHBpdGNoZXIgdGhyb3dzIHRoZSBiYWxsLCAmIHRoZXJlZm9yZSBwcm9iYWJpbGl0eSBvZiBIUiIpDQoNCnRyYWluX2RmICU+JQ0KICBncm91cF9ieShiYl90eXBlKSAlPiUNCiAgc3VtbWFyaXplX2lzX2hvbWVfcnVuKCkgJT4lDQogIGZpbHRlcighaXMubmEoYmJfdHlwZSkpICU+JQ0KICBnZ3Bsb3QoYWVzKGJiX3R5cGUsIHBjdF9pc19ob21lX3J1bikpICsNCiAgZ2VvbV9jb2woKSArDQogIHNjYWxlX3lfY29udGludW91cyhsYWJlbHMgPSBwZXJjZW50KSArDQogIGxhYnMoeSA9ICIlIGhvbWUgcnVuIiwNCiAgICAgICBzdWJ0aXRsZSA9ICJHcm91bmQgYmFsbHMgYW5kIHBvcC11cHMgYXJlIChsaXRlcmFsbHkpICpuZXZlciogaG9tZSBydW5zLiBGbHkgYmFsbHMgb2Z0ZW4gYXJlIikgKw0KICB0aGVtZShwYW5lbC5ncmlkLm1ham9yLnggPSBlbGVtZW50X2JsYW5rKCkpDQoNCnRyYWluX2RmICU+JQ0KICBncm91cF9ieShiZWFyaW5nICkgJT4lDQogIHN1bW1hcml6ZV9pc19ob21lX3J1bigpICU+JSANCiAgbXV0YXRlKGJlYXJpbmcgPSBmY3RfcmVsZXZlbChiZWFyaW5nLCAicmlnaHQiLCAiY2VudGVyIiwgImxlZnQiKSkgJT4lIA0KICBnZ3Bsb3QoYWVzKHBjdF9pc19ob21lX3J1biwgYmVhcmluZykpICsNCiAgZ2VvbV9wb2ludChhZXMoc2l6ZSA9IHBjdCkpICsNCiAgZ2VvbV9lcnJvcmJhcmgoYWVzKHhtaW4gPSBsb3csIHhtYXggPSBoaWdoKSwgaGVpZ2h0ID0gLjMpICsNCiAgc2NhbGVfc2l6ZV9jb250aW51b3VzKGxhYmVscyA9IHBlcmNlbnQsDQogICAgICAgICAgICAgICAgICAgICAgICBndWlkZSA9ICJub25lIiwNCiAgICAgICAgICAgICAgICAgICAgICAgIHJhbmdlID0gYyguNSwgNCkpICsNCiAgc2NhbGVfeF9jb250aW51b3VzKGxhYmVscyA9IHBlcmNlbnQpICsNCiAgbGFicygNCiAgICB4ID0gIlByb3BvcnRpb24gb2YgYXQgYmF0cyIsDQogICAgeSA9ICIiLA0KICAgIHRpdGxlID0gIldoYXQgYmVhcmluZ3MgZ2V0IHRoZSBtb3N0IGhvbWUgcnVucz8iLA0KICAgIHN1YnRpdGxlID0gIkluY2x1ZGluZyA5NSUgaW50ZXJ2YWxzLiBTaXplIG9mIHBvaW50cyBpcyBwcm9wb3J0aW9uYWwgdG8gYXQtYmF0IGZyZXF1ZW5jeSBpbiB0aGUgZGF0YXNldCINCiAgKSArDQogIHRoZW1lKHBhbmVsLmdyaWQubWFqb3IueSA9IGVsZW1lbnRfYmxhbmsoKSkNCg0KdHJhaW5fZGYgJT4lDQogIGdyb3VwX2J5KHBpdGNoX25hbWUgKSAlPiUNCiAgc3VtbWFyaXplX2lzX2hvbWVfcnVuKCkgJT4lDQogIGZpbHRlcihuID4gMTApICU+JSANCiAgbXV0YXRlKHBpdGNoX25hbWUgPSBmY3RfcmVvcmRlcihwaXRjaF9uYW1lLCBwY3RfaXNfaG9tZV9ydW4pKSAlPiUgDQogIGdncGxvdChhZXMocGN0X2lzX2hvbWVfcnVuLCBwaXRjaF9uYW1lKSkgKw0KICBnZW9tX3BvaW50KGFlcyhzaXplID0gcGN0KSkgKw0KICBnZW9tX2Vycm9yYmFyaChhZXMoeG1pbiA9IGxvdywgeG1heCA9IGhpZ2gpLCBoZWlnaHQgPSAuMykgKw0KICBzY2FsZV9zaXplX2NvbnRpbnVvdXMobGFiZWxzID0gcGVyY2VudCwNCiAgICAgICAgICAgICAgICAgICAgICAgIGd1aWRlID0gIm5vbmUiLA0KICAgICAgICAgICAgICAgICAgICAgICAgcmFuZ2UgPSBjKC41LCA0KSkgKw0KICBzY2FsZV94X2NvbnRpbnVvdXMobGFiZWxzID0gcGVyY2VudCkgKw0KICBsYWJzKA0KICAgIHggPSAiUHJvcG9ydGlvbiBvZiBhdCBiYXRzIiwNCiAgICB5ID0gIiIsDQogICAgdGl0bGUgPSAiV2hhdCBwaXRjaCBuYW1lcyBnZXQgdGhlIG1vc3QgaG9tZSBydW5zPyIsDQogICAgc3VidGl0bGUgPSAiSW5jbHVkaW5nIDk1JSBpbnRlcnZhbHMuIFNpemUgb2YgcG9pbnRzIGlzIHByb3BvcnRpb25hbCB0byBhdC1iYXQgZnJlcXVlbmN5IGluIHRoZSBkYXRhc2V0Ig0KICApICsNCiAgdGhlbWUocGFuZWwuZ3JpZC5tYWpvci55ID0gZWxlbWVudF9ibGFuaygpKQ0KDQp0cmFpbl9kZiAlPiUgDQogIGNvdW50KGlzX2hvbWVfcnVuKSAlPiUgDQogIGdncGxvdChhZXMobiwgaXNfaG9tZV9ydW4sIGZpbGwgPSBpc19ob21lX3J1bikpICsNCiAgZ2VvbV9jb2woc2hvdy5sZWdlbmQgPSBGQUxTRSkgKw0KICBzY2FsZV9maWxsX3ZpcmlkaXNfZChvcHRpb24gPSAiSCIpICsNCiAgbGFicyhzdWJ0aXRsZSA9ICJUaGVyZSBhcmUgYSBsb3QgbW9yZSBub24taG9tZSBydW5zIGluIHRoaXMgZGF0YXNldCB0aGFuIGhvbWUgcnVucy4NCiIsIGZpbGwgPSBOVUxMLCB5ID0gTlVMTCkNCg0KYGBgDQoNCiMjIFRpbWUgc2VyaWVzIA0KDQpgYGB7cn0NCnRyYWluX2RmICU+JQ0KICBncm91cF9ieSh3ZWVrID0gYXMuRGF0ZSgiMjAyMC0wMS0wMSIpICsgbHVicmlkYXRlOjp3ZWVrKGdhbWVfZGF0ZSkgKiA3KSAlPiUNCiAgc3VtbWFyaXplX2lzX2hvbWVfcnVuKCkgJT4lDQogIGdncGxvdChhZXMod2VlaywgcGN0X2lzX2hvbWVfcnVuKSkgKw0KICBnZW9tX3BvaW50KGFlcyhzaXplID0gbikpICsNCiAgZ2VvbV9saW5lKCkgKw0KICBnZW9tX3JpYmJvbihhZXMoeW1pbiA9IGxvdywgeW1heCA9IGhpZ2gpLCBhbHBoYSA9IC4yKSArDQogIGV4cGFuZF9saW1pdHMoeSA9IDApICsNCiAgc2NhbGVfeF9kYXRlKGRhdGVfbGFiZWxzID0gIiViIiwNCiAgICAgICAgICAgICAgIGRhdGVfYnJlYWtzID0gIm1vbnRoIiwNCiAgICAgICAgICAgICAgIG1pbm9yX2JyZWFrcyA9IE5VTEwpICsNCiAgc2NhbGVfeV9jb250aW51b3VzKGxhYmVscyA9IHBlcmNlbnQpICsNCiAgc2NhbGVfc2l6ZV9jb250aW51b3VzKGd1aWRlID0gIm5vbmUiKSArDQogIGxhYnMoeCA9IE5VTEwsDQogICAgICAgeSA9ICIlIGhvbWUgcnVucyIsDQogICAgICAgdGl0bGUgPSAiSG9tZSBSdW5zIGFyZSBtb3JlIGNvbW1vbiBsYXRlciBpbiB0aGUgc2Vhc29uISIsDQogICAgICAgc3VidGl0bGUgPSBnbHVlOjpnbHVlKCJSaWJib24gc2hvd3MgOTUlIGNvbmZpZGVuY2UgYm91bmQgYnkgd2VlayBmb3IgZGF0YXNldCBzcGFubmluZyB7IG1pbih0cmFpbl9kZiRnYW1lX2RhdGUpIH0gdGhydSB7IG1heCh0cmFpbl9kZiRnYW1lX2RhdGUpIH0uIikpDQoNCmBgYA0KDQpgYGB7ciBudW1lcmljIGZlYXR1cmUgcGxvdHMsIGZpZy5hc3A9MX0NCg0KdHJhaW5fZGYgJT4lDQogIGdyb3VwX2J5KG5hbWUsIGxmX2RpbSwgY2ZfZGltLCByZl9kaW0sIGxmX3csIGNmX3csIHJmX3cpICU+JQ0KICBzdW1tYXJpemVfaXNfaG9tZV9ydW4oKSAlPiUgDQogIHBpdm90X2xvbmdlcihjb2xzID0gbGZfZGltOnJmX3csIG5hbWVzX3RvID0gIm1ldHJpYyIsIHZhbHVlc190byA9ICJ2YWx1ZSIpICU+JQ0KICBnZ3Bsb3QoYWVzKHZhbHVlLCBwY3RfaXNfaG9tZV9ydW4pKSArDQogIGdlb21fcG9pbnQoKSArDQogIGdlb21fdGV4dChhZXMobGFiZWwgPSBuYW1lKSwgDQogICAgICAgICAgICBjaGVja19vdmVybGFwID0gVFJVRSwgDQogICAgICAgICAgICB2anVzdCA9IDEsIA0KICAgICAgICAgICAgaGp1c3QgPSAxKSArDQogIGZhY2V0X3dyYXAofiBtZXRyaWMsIHNjYWxlcyA9ICJmcmVlX3giKSArDQogIGxhYnMoc3VidGl0bGUgPSAiTm8gdHJlbmRzIHdoZXJlIGEgcGFyaydzIGRpbWVuc2lvbnMgYXJlIHN0YXRpc3RpY2FsbHkgc2lnbmlmaWNhbnQiKQ0KDQp0cmFpbl9kZiAlPiUNCiAgZ3JvdXBfYnkobmFtZSwgbGZfZGltLCBjZl9kaW0sIHJmX2RpbSwgbGZfdywgY2ZfdywgcmZfdykgJT4lDQogIHN1bW1hcml6ZV9pc19ob21lX3J1bigpICU+JSANCiAgcGl2b3RfbG9uZ2VyKGNvbHMgPSBsZl9kaW06cmZfdywgbmFtZXNfdG8gPSAibWV0cmljIiwgdmFsdWVzX3RvID0gInZhbHVlIikgJT4lDQogIGdyb3VwX2J5KG1ldHJpYykgJT4lDQogIHN1bW1hcml6ZSh0aWR5KGNvci50ZXN0KHZhbHVlLCBwY3RfaXNfaG9tZV9ydW4gKSkpDQoNCmBgYA0KDQpgYGB7cn0NCnRyYWluX2RmICU+JQ0KICBzZWxlY3QoaXNfaG9tZV9ydW4sIHBsYXRlX3g6bGF1bmNoX2FuZ2xlKSAlPiUNCiAgcGl2b3RfbG9uZ2VyKGNvbHMgPSAtaXNfaG9tZV9ydW4sbmFtZXNfdG8gPSAiZmVhdHVyZSIsdmFsdWVzX3RvID0gICJ2YWx1ZSIpICU+JQ0KICBnZ3Bsb3QoYWVzKHZhbHVlLCBmaWxsID0gaXNfaG9tZV9ydW4pKSArDQogIGdlb21fZGVuc2l0eShhbHBoYSA9IC41KSArDQogIHNjYWxlX2ZpbGxfdmlyaWRpc19kKG9wdGlvbiA9ICJIIikgKw0KICBmYWNldF93cmFwKH4gZmVhdHVyZSwgc2NhbGVzID0gImZyZWUiKSArDQogIGxhYnMoc3VidGl0bGUgPSAiVGhlcmUncyBhIHN3ZWV0IHNwb3Qgb2YgbGF1bmNoIGFuZ2xlICYgc3BlZWQgd2hlcmUgaG9tZSBydW5zIGhhcHBlbiIsDQogICAgICAgZmlsbCA9ICJIb21lIFJ1biIpICsNCiAgdGhlbWUobGVnZW5kLnBvc2l0aW9uID0gYygwLjgsIDAuMykpDQpgYGANCg0KDQpgYGB7cn0NCnRyYWluX2RmICU+JQ0KICBncm91cF9ieShsYXVuY2hfYW5nbGVfYnVja2V0ID0gcm91bmQobGF1bmNoX2FuZ2xlICogMiwgLTEpIC8gMiwNCiAgICAgICAgICAgbGF1bmNoX3NwZWVkX2J1Y2tldCA9IHJvdW5kKGxhdW5jaF9zcGVlZCAqIDIsIC0xKSAvIDIpICU+JQ0KICBzdW1tYXJpemVfaXNfaG9tZV9ydW4oKSAlPiUNCiAgZmlsdGVyKG4gPj0gMzApICU+JQ0KICBmaWx0ZXIoY29tcGxldGUuY2FzZXMoLikpICU+JQ0KICBnZ3Bsb3QoYWVzKGxhdW5jaF9zcGVlZF9idWNrZXQsIGxhdW5jaF9hbmdsZV9idWNrZXQsIGZpbGwgPSBwY3RfaXNfaG9tZV9ydW4pKSArDQogIGdlb21fdGlsZSgpICsNCiAgc2NhbGVfZmlsbF92aXJpZGlzX2Mob3B0aW9uID0gIkgiLCBsYWJlbHMgPSBzY2FsZXM6OnBlcmNlbnQpICArDQogIGxhYnMoeCA9ICJMYXVuY2ggU3BlZWQiLA0KICAgICAgIHkgPSAiTGF1bmNoIEFuZ2xlIiwNCiAgICAgICB0aXRsZSA9ICJUaGVyZSBpcyBhIHN3ZWV0IHNwb3Qgb2YgaGlnaCBzcGVlZCArIG1vZGVyYXRlIGFuZ2xlIiwNCiAgICAgICBzdWJ0aXRsZSA9ICJSb3VuZGVkIHRvIHRoZSBuZWFyZXN0IDUgb24gZWFjaCBzY2FsZTsgbm8gYnVja2V0cyBzaG93biB3aXRoIDwzMCBkYXRhIHBvaW50cyIsDQogICAgICAgZmlsbCA9ICIlIEhSIikNCmBgYA0KDQoNCmBgYHtyfQ0KdHJhaW5fZGYgJT4lDQogIGdyb3VwX2J5KHBsYXRlX3ggPSByb3VuZChwbGF0ZV94LCAxKSwNCiAgICAgICAgICAgcGxhdGVfeiA9IHJvdW5kKHBsYXRlX3osIDEpKSAlPiUNCiAgc3VtbWFyaXplX2lzX2hvbWVfcnVuKCkgJT4lDQogIGZpbHRlcihuID49IDMwKSAlPiUNCiAgZmlsdGVyKGNvbXBsZXRlLmNhc2VzKC4pKSAlPiUNCiAgZ2dwbG90KGFlcyhwbGF0ZV94LCBwbGF0ZV96LCB6ID0gcGN0X2lzX2hvbWVfcnVuKSkgKw0KICBzdGF0X3N1bW1hcnlfaGV4KGFscGhhID0gMC45LCBiaW5zID0gMTApICsNCiAgc2NhbGVfZmlsbF92aXJpZGlzX2Mob3B0aW9uID0gIkgiLCBsYWJlbHMgPSBzY2FsZXM6OnBlcmNlbnQpICArDQogIGdlb21fdmxpbmUoeGludGVyY2VwdCA9IDAsIGx0eSA9IDIpICsNCiAgbGFicyh4ID0gIlJlbGF0aXZlIHBvc2l0aW9uIGZyb20gY2VudGVyIHBsYXRlIChpbiBmZWV0KSIsDQogICAgICAgeSA9ICJEaXN0YW5jZSBhYm92ZSBwbGF0ZSAoaW4gZmVldCkiLA0KICAgICAgIHRpdGxlID0gIlRoZSBiZXN0IHBsYWNlIGlzIGNlbnRlciBwbGF0ZSwgYWJvdXQgMi41LTMuNSBmZWV0IHVwIiwNCiAgICAgICBzdWJ0aXRsZSA9ICJSb3VuZGVkIHRvIHRoZSBuZWFyZXN0IDUgb24gZWFjaCBzY2FsZTsgbm8gYnVja2V0cyBzaG93biB3aXRoIDwzMCBkYXRhIHBvaW50cyIsDQogICAgICAgZmlsbCA9ICIlIEhSIikNCmBgYA0KDQotLS0tDQoNCiMgTWFjaGluZSBMZWFybmluZzogUmFuZG9tIEZvcmVzdCB7LnRhYnNldH0NCg0KTGV0J3MgcnVuIG1vZGVscyBpbiB0d28gc3RlcHMuIFRoZSBmaXJzdCBpcyBhIHNpbXBsZSwgZmFzdCBzaGFsbG93IHJhbmRvbSBmb3Jlc3QsIHRvIGNvbmZpcm0gdGhhdCB0aGUgbW9kZWwgd2lsbCBydW4gYW5kIG9ic2VydmUgZmVhdHVyZSBpbXBvcnRhbmNlIHNjb3Jlcy4gVGhlIHNlY29uZCB3aWxsIHVzZSBgeGdib29zdGAuIEJvdGggdXNlIHRoZSBiYXNpYyByZWNpcGUgcHJlcHJvY2Vzc29yIGZvciBub3cuDQoNCiMjIFRoZSByZWNpcGUNCg0KVG8gbW92ZSBxdWlja2x5IEkgc3RhcnRlZCB3aXRoIHRoaXMgYmFzaWMgcmVjaXBlLg0KDQpgYGB7ciBiYXNpYyByZWNpcGV9DQpiYXNpY19yZWMgPC0NCiAgcmVjaXBlKA0KICAgIGlzX2hvbWVfcnVuIH4gYmJfdHlwZSArIA0KICAgICAgcGl0Y2hfbXBoICsgDQogICAgICBsYXVuY2hfc3BlZWQgKw0KICAgICAgbGF1bmNoX2FuZ2xlICsNCiAgICAgIHBsYXRlX3ggKw0KICAgICAgcGxhdGVfeiArDQogICAgICBpc19iYXR0ZXJfbGVmdHkgKyANCiAgICAgIGlzX3BpdGNoZXJfbGVmdHkgLA0KICAgIGRhdGEgPSB0cmFpbl9kZg0KICApIA0KDQpgYGANCg0KIyMgRGF0YXNldCBmb3IgbW9kZWxpbmcNCg0KYGBge3IganVpY2UgdGhlIGRhdGFzZXR9DQpiYXNpY19yZWMgJT4lIA0KIyAgZmluYWxpemVfcmVjaXBlKGxpc3QobnVtX2NvbXAgPSAyKSkgJT4lIA0KICBwcmVwKCkgJT4lIA0KICBqdWljZSgpIA0KDQpgYGANCg0KIyMgQ3Jvc3MgVmFsaWRhdGlvbg0KDQpXZSB3aWxsIHVzZSA1LWZvbGQgY3Jvc3MgdmFsaWRhdGlvbiBhbmQgc3RyYXRpZnkgb24gdGhlIG91dGNvbWUgdG8gYnVpbGQgbW9kZWxzIHRoYXQgYXJlIGxlc3MgbGlrZWx5IHRvIG92ZXItZml0IHRoZSB0cmFpbmluZyBkYXRhLg0KDQpQcm9wZXIgYnVzaW5lc3MgbW9kZWxpbmcgcHJhY3RpY2Ugd291bGQgaG9sZG91dCBhIHNhbXBsZSBmcm9tIHRyYWluaW5nIGVudGlyZWx5IGZvciBhc3Nlc3NpbmcgbW9kZWwgcGVyZm9ybWFuY2UuIEkndmUgbWFkZSBhbiBleGNlcHRpb24gaGVyZSBmb3IgS2FnZ2xlLg0KDQpgYGB7ciBjcm9zcyB2YWxpZGF0aW9ufQ0Kc2V0LnNlZWQoMjAyMSkNCg0KKGZvbGRzIDwtIHZmb2xkX2N2KHRyYWluX2RmLCB2ID0gNSwgc3RyYXRhID0gaXNfaG9tZV9ydW4pKQ0KDQpgYGANCg0KIyMgTW9kZWwgU3BlY2lmaWNhdGlvbg0KDQpUaGlzIGZpcnN0IG1vZGVsIGlzIGEgYmFnZ2VkIHRyZWUsIHdoZXJlIHRoZSBudW1iZXIgb2YgcHJlZGljdG9ycyB0byBjb25zaWRlciBmb3IgZWFjaCBzcGxpdCBvZiBhIHRyZWUgKGkuZS4sIG10cnkpIGVxdWFscyB0aGUgbnVtYmVyIG9mIGFsbCBhdmFpbGFibGUgcHJlZGljdG9ycy4gVGhlIGBtaW5fbmAgb2YgMTAgbWVhbnMgdGhhdCBlYWNoIHRyZWUgYnJhbmNoIG9mIHRoZSA1MCBkZWNpc2lvbiB0cmVlcyBidWlsdCBoYXZlIGF0IGxlYXN0IDEwIG9ic2VydmF0aW9ucy4gQXMgYSByZXN1bHQsIHRoZSBkZWNpc2lvbiB0cmVlcyBpbiB0aGUgZW5zZW1ibGUgYWxsIGFyZSByZWxhdGl2ZWx5IHNoYWxsb3cuDQoNCmBgYHtyIHJhbmRvbSBmb3Jlc3Qgc3BlY30NCg0KKGJhZ19zcGVjIDwtDQogIGJhZ190cmVlKG1pbl9uID0gMTApICU+JQ0KICBzZXRfZW5naW5lKCJycGFydCIsIHRpbWVzID0gNTApICU+JQ0KICBzZXRfbW9kZSgiY2xhc3NpZmljYXRpb24iKSkNCg0KYGBgDQoNCiMjIFBhcmFsbGVsIGJhY2tlbmQNCg0KVG8gc3BlZWQgdXAgY29tcHV0YXRpb24gd2Ugd2lsbCB1c2UgYSBwYXJhbGxlbCBiYWNrZW5kLg0KDQpgYGB7ciBwYXJhbGxlbCBiYWNrZW5kfQ0KYWxsX2NvcmVzIDwtIHBhcmFsbGVsbHk6OmF2YWlsYWJsZUNvcmVzKG9taXQgPSAxKQ0KYWxsX2NvcmVzDQoNCmZ1dHVyZTo6cGxhbigibXVsdGlzZXNzaW9uIiwgd29ya2VycyA9IGFsbF9jb3JlcykgIyBvbiBXaW5kb3dzDQoNCmBgYA0KDQojIyBGaXQgYW5kIFZhcmlhYmxlIEltcG9ydGFuY2UNCg0KTGV0cyBtYWtlIGEgY3Vyc29yeSBjaGVjayBvZiB0aGUgcmVjaXBlIGFuZCB2YXJpYWJsZSBpbXBvcnRhbmNlLCB3aGljaCBjb21lcyBvdXQgb2YgYHJwYXJ0YCBmb3IgZnJlZS4gVGhpcyB3b3JrZmxvdyBhbHNvIGhhbmRsZXMgZmFjdG9ycyB3aXRob3V0IGR1bW1pZXMuDQoNCmBgYHtyIGZpdCByYW5kb20gZm9yZXN0LCBmaWcuYXNwPTF9DQpiYWdfd2YgPC0NCiAgd29ya2Zsb3coKSAlPiUNCiAgYWRkX3JlY2lwZShiYXNpY19yZWMpICU+JQ0KICBhZGRfbW9kZWwoYmFnX3NwZWMpDQoNCmJhZ19maXQgPC0gcGFyc25pcDo6Zml0KGJhZ193ZiwgZGF0YSA9IHRyYWluX2RmKQ0KDQpleHRyYWN0X2ZpdF9wYXJzbmlwKGJhZ19maXQpJGZpdCRpbXAgJT4lDQogIG11dGF0ZSh0ZXJtID0gZmN0X3Jlb3JkZXIodGVybSwgdmFsdWUpKSAlPiUNCiAgZ2dwbG90KGFlcyh2YWx1ZSwgdGVybSkpICsNCiAgZ2VvbV9wb2ludCgpICsNCiAgZ2VvbV9lcnJvcmJhcmgoYWVzKA0KICAgIHhtaW4gPSB2YWx1ZSAtIGBzdGQuZXJyb3JgIC8gMiwNCiAgICB4bWF4ID0gdmFsdWUgKyBgc3RkLmVycm9yYCAvIDINCiAgKSwNCiAgaGVpZ2h0ID0gLjMpICsNCiAgbGFicyh0aXRsZSA9ICJGZWF0dXJlIEltcG9ydGFuY2UiLA0KICAgICAgIHggPSBOVUxMLCB5ID0gTlVMTCkNCg0KYGBgDQoNCg0KYGBge3IgcGVyZm9ybWFuY2Ugb2YgcmFuZG9tIGZvcmVzdH0NCmF1Z21lbnQoYmFnX2ZpdCwgdHJhaW5fZGYpICU+JSANCiAgc2VsZWN0KGlzX2hvbWVfcnVuLCAucHJlZF95ZXMpICU+JSANCiAgbW5fbG9nX2xvc3ModHJ1dGggPSBpc19ob21lX3J1biwgZXN0aW1hdGUgPSAucHJlZF95ZXMsIGV2ZW50X2xldmVsID0gInNlY29uZCIpDQpgYGANCg0KV293LCB0aGF0J3Mgbm90IHRvbyBzaGFiYnkuIE9mIGNvdXJzZSwgdGhpcyBtYXkgaGF2ZSBvdmVyZml0dGVkLiBMZXQncyBiYW5rIHRoaXMgZmlyc3Qgc3VibWlzc2lvbiB0byBLYWdnbGUgYXMtaXMsIGFuZCB3b3JrIG1vcmUgd2l0aCBgeGdib29zdGAgdG8gZG8gYmV0dGVyLg0KDQpgYGB7ciB3cml0ZSBjc3YgcmFuZG9tIGZvcmVzdCwgZXZhbCA9IEZBTFNFfQ0Kc3VibWlzc2lvbiA8LSBhdWdtZW50KGJhZ19maXQsIGhvbGRvdXRfZGYpICU+JSANCiAgc2VsZWN0KGJpcF9pZCwgaXNfaG9tZV9ydW4gPSAucHJlZF95ZXMpIA0KDQogd3JpdGVfY3N2KHN1Ym1pc3Npb24sIGZpbGUgPSBwYXRoX2V4cG9ydCkNCg0KYGBgDQoNCmBgYHtyIHBvc3QgY3N2IHJhbmRvbSBmb3Jlc3QsIGV2YWwgPSBGQUxTRX0NCnNoZWxsKGdsdWU6OmdsdWUoJ2thZ2dsZSBjb21wZXRpdGlvbnMgc3VibWl0IC1jIHsgY29tcGV0aXRpb25fbmFtZSB9IC1mIHsgcGF0aF9leHBvcnQgfSAtbSAiRmlyc3QgbW9kZWwiJykpDQpgYGANCg0KIyB7LX0NCg0KLS0tLQ0KDQojIE1hY2hpbmUgTGVhcm5pbmc6IFhHQm9vc3QgTW9kZWwgMSB7LnRhYnNldH0NCg0KIyMgTW9kZWwgU3BlY2lmaWNhdGlvbg0KDQpMZXQncyBzdGFydCB3aXRoIGEgYm9vc3RlZCBtb2RlbCB0aGF0IHJ1bnMgZmFzdCBhbmQgZ2l2ZXMgYW4gZWFybHkgaW5kaWNhdGlvbiBvZiB3aGljaCBoeXBlcnBhcmFtZXRlcnMgbWFrZSB0aGUgbW9zdCBkaWZmZXJlbmNlIGluIG1vZGVsIHBlcmZvcm1hbmNlLg0KDQpgYGB7ciB4Z2Jvb3N0IHNwZWMgb25lfQ0KKHhnYm9vc3Rfc3BlYyA8LSBib29zdF90cmVlKHRyZWVzID0gdHVuZSgpLA0KICAgICAgICAgICAgICAgICAgICAgICAgICAgIG1pbl9uID0gdHVuZSgpLA0KICAgICAgICAgICAgICAgICAgICAgICAgICAgIGxlYXJuX3JhdGUgPSB0dW5lKCksDQogICAgICAgICAgICAgICAgICAgICAgICAgICAgdHJlZV9kZXB0aCA9IHR1bmUoKSwNCiAgICAgICAgICAgICAgICAgICAgICAgICAgICBzdG9wX2l0ZXIgPSAyMCkgJT4lIA0KICBzZXRfZW5naW5lKCJ4Z2Jvb3N0IiwgdmFsaWRhdGlvbiA9IDAuMikgJT4lDQogIHNldF9tb2RlKCJjbGFzc2lmaWNhdGlvbiIpKQ0KYGBgDQoNCiMjIFR1bmluZyBhbmQgUGVyZm9ybWFuY2UNCg0KV2Ugd2lsbCB1c2UgdGhlIGJhc2ljIHJlY2lwZSBmcm9tIGFib3ZlIGFuZCBzaW1wbHkgZHVtbXkgdGhlIGNhdGVnb3JpY2FsIHByZWRpY3RvcnMuDQoNCmBgYHtyIHR1bmUgZ3JpZCB4Z2Jvb3N0IG9uZSByZWN9DQpzZWNvbmRfcmVjIDwtDQogIHJlY2lwZSgNCiAgICBpc19ob21lX3J1biB+IGJiX3R5cGUgKyANCiAgICAgIHBpdGNoX21waCArIA0KICAgICAgbGF1bmNoX3NwZWVkICsNCiAgICAgIGxhdW5jaF9hbmdsZSArDQogICAgICBwbGF0ZV94ICsNCiAgICAgIHBsYXRlX3ogKw0KICAgICAgaXNfYmF0dGVyX2xlZnR5ICsgDQogICAgICBpc19waXRjaGVyX2xlZnR5ICwNCiAgICBkYXRhID0gdHJhaW5fZGYNCiAgKSAlPiUgDQogIHN0ZXBfdW5rbm93bihhbGxfbm9taW5hbF9wcmVkaWN0b3JzKCkpICU+JSANCiAgc3RlcF9kdW1teShhbGxfbm9taW5hbF9wcmVkaWN0b3JzKCkpICU+JSANCiAgc3RlcF9pbXB1dGVfbGluZWFyKGxhdW5jaF9hbmdsZSwgbGF1bmNoX3NwZWVkLA0KICAgIGltcHV0ZV93aXRoID0gaW1wX3ZhcnMocGxhdGVfeCwgcGxhdGVfeiwgcGl0Y2hfbXBoKQ0KICApICU+JQ0KICBzdGVwX256dihhbGxfcHJlZGljdG9ycygpKQ0KYGBgDQoNCmBgYHtyIHR1bmUgZ3JpZCB4Z2Jvb3N0IG9uZSBub2V2YWwsIGV2YWwgPSBGQUxTRX0NCmN2X3Jlc194Z2Jvb3N0IDwtDQogIHdvcmtmbG93KCkgJT4lIA0KICBhZGRfcmVjaXBlKHNlY29uZF9yZWMpICU+JSANCiAgYWRkX21vZGVsKHhnYm9vc3Rfc3BlYykgJT4lIA0KICB0dW5lX2dyaWQoICAgIA0KICAgIHJlc2FtcGxlcyA9IGZvbGRzLA0KICAgIGdyaWQgPSA3LA0KICAgIG1ldHJpY3MgPSBtc2V0DQopDQpgYGANCg0KYGBge3IgdHVuZSBncmlkIHhnYm9vc3Qgb25lIG5vaW5jbHVkZSwgaW5jbHVkZSA9IEZBTFNFfQ0KaWYgKGZpbGUuZXhpc3RzKGhlcmU6OmhlcmUoImRhdGEiLCAiYmFzZWJhbGxIUnhnYm9vc3QucmRzIikpKSB7DQpjdl9yZXNfeGdib29zdCA8LSByZWFkX3JkcyhoZXJlOjpoZXJlKCJkYXRhIiwgImJhc2ViYWxsSFJ4Z2Jvb3N0LnJkcyIpKQ0KfSBlbHNlIHsNCg0KY3ZfcmVzX3hnYm9vc3QgPC0NCiAgd29ya2Zsb3coKSAlPiUgDQogIGFkZF9yZWNpcGUoc2Vjb25kX3JlYykgJT4lIA0KICBhZGRfbW9kZWwoeGdib29zdF9zcGVjKSAlPiUgDQogIHR1bmVfZ3JpZCggICAgDQogICAgcmVzYW1wbGVzID0gZm9sZHMsDQogICAgZ3JpZCA9IDcsDQogICAgbWV0cmljcyA9IG1zZXQNCikNCndyaXRlX3Jkcyhjdl9yZXNfeGdib29zdCwgaGVyZTo6aGVyZSgiZGF0YSIsICJiYXNlYmFsbEhSeGdib29zdC5yZHMiKSkNCn0NCmBgYA0KDQpgYGB7ciB4Z2Jvb3N0IG9uZSBwZXJmb3JtYW5jZX0NCmF1dG9wbG90KGN2X3Jlc194Z2Jvb3N0KQ0KDQpjb2xsZWN0X21ldHJpY3MoY3ZfcmVzX3hnYm9vc3QpICU+JSANCiAgYXJyYW5nZShtZWFuKQ0KDQp4Z2Jfd2ZfYmVzdCA8LSAgIA0KICB3b3JrZmxvdygpICU+JSANCiAgYWRkX3JlY2lwZShzZWNvbmRfcmVjKSAlPiUgDQogIGFkZF9tb2RlbCh4Z2Jvb3N0X3NwZWMpICU+JSANCiAgZmluYWxpemVfd29ya2Zsb3coc2VsZWN0X2Jlc3QoY3ZfcmVzX3hnYm9vc3QpKQ0KDQpmaXRfYmVzdCA8LSB4Z2Jfd2ZfYmVzdCAlPiUNCiAgcGFyc25pcDo6Zml0KGRhdGEgPSB0cmFpbl9kZikNCg0KYXVnbWVudChmaXRfYmVzdCwgdHJhaW5fZGYpICU+JSANCiAgc2VsZWN0KGlzX2hvbWVfcnVuLCAucHJlZF95ZXMpICU+JSANCiAgbW5fbG9nX2xvc3ModHJ1dGggPSBpc19ob21lX3J1biwgDQogICAgICAgICAgICAgIGVzdGltYXRlID0gLnByZWRfeWVzLCANCiAgICAgICAgICAgICAgZXZlbnRfbGV2ZWwgPSAic2Vjb25kIikNCg0KYGBgDQoNCk9uIHRyYWluaW5nIGRhdGEsIHRoaXMgbG9nIGxvc3MgZmlndXJlIGlzIG5vdCBhbiBpbXByb3ZlbWVudC4gSSBhbSBnb2luZyB0byBhdHRlbXB0IHRvIHBvc3QgdGhpcyBzZWNvbmQgc3VibWlzc2lvbiB0byBLYWdnbGUgYW55d2F5LCBhbmQgd29yayBtb3JlIHdpdGggYHhnYm9vc3RgIGFuZCBhIG1vcmUgYWR2YW5jZWQgcmVjaXBlIHRvIGRvIGJldHRlci4NCg0KYGBge3Igd3JpdGUgY3N2IHhnYm9vc3QxLCBldmFsID0gRkFMU0V9DQpzdWJtaXNzaW9uIDwtIGF1Z21lbnQoZml0X2Jlc3QsIGhvbGRvdXRfZGYpICU+JSANCiAgc2VsZWN0KGJpcF9pZCwgaXNfaG9tZV9ydW4gPSAucHJlZF95ZXMpIA0KDQp3cml0ZV9jc3Yoc3VibWlzc2lvbiwgZmlsZSA9IHBhdGhfZXhwb3J0KQ0KDQpgYGANCg0KYGBge3IgcG9zdCBjc3YgeGdib29zdDEsIGV2YWwgPSBGQUxTRX0NCnNoZWxsKGdsdWU6OmdsdWUoJ2thZ2dsZSBjb21wZXRpdGlvbnMgc3VibWl0IC1jIHsgY29tcGV0aXRpb25fbmFtZSB9IC1mIHsgcGF0aF9leHBvcnQgfSAtbSAiU2Vjb25kIG1vZGVsIicpKQ0KYGBgDQoNCiMgey19DQoNCi0tLS0NCg0KIyBNYWNoaW5lIExlYXJuaW5nOiBYR0Jvb3N0IE1vZGVsIDIgey50YWJzZXR9DQoNCkxldCdzIHVzZSB3aGF0IHdlIGxlYXJuZWQgYWJvdmUgdG8gc2V0IGEgbW9yZSBhZHZhbmNlZCByZWNpcGUuIFRoaXMgdGltZSwgbGV0J3MgYWxzbyB0cnkgdGhlYHR1bmVfcmFjZV9hbm92YWAgdGVjaG5pcXVlIGZvciBza2lwcGluZyB0aGUgcGFydHMgb2YgdGhlIGdyaWQgc2VhcmNoIHRoYXQgZG8gbm90IHBlcmZvcm0gd2VsbC4NCg0KIyMgQWR2YW5jZWQgUmVjaXBlDQoNCmBgYHtyfQ0KDQphZHZhbmNlZF9yZWMgPC0NCiAgcmVjaXBlKA0KICAgIGlzX2hvbWVfcnVuIH4gYmJfdHlwZSArIHBpdGNoX21waCArIGxhdW5jaF9zcGVlZCArIGxhdW5jaF9hbmdsZSArDQogICAgICBwbGF0ZV94ICsgcGxhdGVfeiArIGlubmluZyArIGJhbGxzICsgc3RyaWtlcyArDQogICAgICBpc19waXRjaGVyX2xlZnR5ICsgaXNfYmF0dGVyX2xlZnR5ICsNCiAgICAgIGdhbWVfZGF0ZSArIGhvbWVfdGVhbSArIGJhdHRlcl90ZWFtICsgYmVhcmluZyAsDQogICAgZGF0YSA9IHRyYWluX2RmDQogICkgJT4lDQogIHN0ZXBfZGF0ZShnYW1lX2RhdGUsIGZlYXR1cmVzID0gIndlZWsiLCBrZWVwX29yaWdpbmFsX2NvbHMgPSBGQUxTRSkgJT4lIA0KICBzdGVwX211dGF0ZShpc19ob21lX3RlYW0gPSBob21lX3RlYW0gPT0gYmF0dGVyX3RlYW0pICU+JSANCiAgc3RlcF9ybShob21lX3RlYW0pICU+JSANCiAgc3RlcF91bmtub3duKGFsbF9ub21pbmFsX3ByZWRpY3RvcnMoKSkgJT4lDQogIHN0ZXBfZHVtbXkoYWxsX25vbWluYWxfcHJlZGljdG9ycygpKSAlPiUgDQogIHN0ZXBfaW1wdXRlX2xpbmVhcihsYXVuY2hfYW5nbGUsIGxhdW5jaF9zcGVlZCwNCiAgICBpbXB1dGVfd2l0aCA9IGltcF92YXJzKHBsYXRlX3gsIHBsYXRlX3osIHBpdGNoX21waCkNCiAgKSAlPiUNCiAgc3RlcF9uenYoYWxsX3ByZWRpY3RvcnMoKSkNCmBgYA0KDQojIyBNb2RlbCBTcGVjaWZpY2F0aW9uDQoNCmBgYHtyIHNwZWMgeGdib29zdCB0d299DQoNCih4Z2Jvb3N0X3NwZWMgPC0gYm9vc3RfdHJlZSh0cmVlcyA9IHR1bmUoKSwNCiAgICAgICAgICAgICAgICAgICAgICAgICAgICBtaW5fbiA9IHR1bmUoKSwNCiAgICAgICAgICAgICAgICAgICAgICAgICAgICBtdHJ5ID0gdHVuZSgpLA0KICAgICAgICAgICAgICAgICAgICAgICAgICAgIGxlYXJuX3JhdGUgPSAwLjAxKSAlPiUgDQogIHNldF9lbmdpbmUoInhnYm9vc3QiKSAlPiUNCiAgc2V0X21vZGUoImNsYXNzaWZpY2F0aW9uIikpDQoNCmBgYA0KDQojIyBUdW5pbmcgYW5kIFBlcmZvcm1hbmNlDQoNCmBgYHtyIHR1bmUgZ3JpZCB4Z2Jvb3N0IHR3byBub2V2YWwsIGV2YWwgPSBGQUxTRX0NCmN2X3Jlc194Z2Jvb3N0IDwtDQogIHdvcmtmbG93KCkgJT4lIA0KICBhZGRfcmVjaXBlKGFkdmFuY2VkX3JlYykgJT4lIA0KICBhZGRfbW9kZWwoeGdib29zdF9zcGVjKSAlPiUgDQogIHR1bmVfcmFjZV9hbm92YSggICAgDQogICAgcmVzYW1wbGVzID0gZm9sZHMsDQogICAgZ3JpZCA9IDEyLA0KICAgIGNvbnRyb2wgPSBjb250cm9sX3JhY2UodmVyYm9zZV9lbGltID0gVFJVRSwNCiAgICAgICAgICAgICAgICAgICAgICAgICAgIHBhcmFsbGVsX292ZXIgPSAicmVzYW1wbGVzIiksDQogICAgbWV0cmljcyA9IG1zZXQNCikNCmBgYA0KDQpgYGB7ciB0dW5lIGdyaWQgeGdib29zdCB0d28gbm9pbmNsdWRlLCBpbmNsdWRlID0gRkFMU0V9DQppZiAoZmlsZS5leGlzdHMoaGVyZTo6aGVyZSgiZGF0YSIsICJiYXNlYmFsbEhSeGdib29zdDIucmRzIikpKSB7DQpjdl9yZXNfeGdib29zdCA8LSByZWFkX3JkcyhoZXJlOjpoZXJlKCJkYXRhIiwgImJhc2ViYWxsSFJ4Z2Jvb3N0Mi5yZHMiKSkNCn0gZWxzZSB7DQpjdl9yZXNfeGdib29zdCA8LQ0KICB3b3JrZmxvdygpICU+JSANCiAgYWRkX3JlY2lwZShhZHZhbmNlZF9yZWMpICU+JSANCiAgYWRkX21vZGVsKHhnYm9vc3Rfc3BlYykgJT4lIA0KICB0dW5lX3JhY2VfYW5vdmEoICAgIA0KICAgIHJlc2FtcGxlcyA9IGZvbGRzLA0KICAgIGdyaWQgPSAxMiwNCiAgICBjb250cm9sID0gY29udHJvbF9yYWNlKHZlcmJvc2VfZWxpbSA9IFRSVUUsDQogICAgICAgICAgICAgICAgICAgICAgICAgICBwYXJhbGxlbF9vdmVyID0gInJlc2FtcGxlcyIpLA0KICAgIG1ldHJpY3MgPSBtc2V0DQopDQp3cml0ZV9yZHMoY3ZfcmVzX3hnYm9vc3QsIGhlcmU6OmhlcmUoImRhdGEiLCAiYmFzZWJhbGxIUnhnYm9vc3QyLnJkcyIpKQ0KfQ0KYGBgDQoNCldlIGNhbiB2aXN1YWxpemUgaG93IHRoZSBwb3NzaWJsZSBwYXJhbWV0ZXIgY29tYmluYXRpb25zIHdlIHRyaWVkIGRpZCBkdXJpbmcgdGhlIOKAnHJhY2Uu4oCdIE5vdGljZSBob3cgd2Ugc2F2ZWQgYSBUT04gb2YgdGltZSBieSBub3QgZXZhbHVhdGluZyB0aGUgcGFyYW1ldGVyIGNvbWJpbmF0aW9ucyB0aGF0IHdlcmUgY2xlYXJseSBkb2luZyBwb29ybHkgb24gYWxsIHRoZSByZXNhbXBsZXM7IHdlIG9ubHkga2VwdCBnb2luZyB3aXRoIHRoZSBnb29kIHBhcmFtZXRlciBjb21iaW5hdGlvbnMuDQoNCmBgYHtyfQ0KcGxvdF9yYWNlKGN2X3Jlc194Z2Jvb3N0KQ0KYGBgDQoNCkFuZCB3ZSBjYW4gbG9vayBhdCB0aGUgdG9wIHJlc3VsdHMNCg0KYGBge3J9DQphdXRvcGxvdChjdl9yZXNfeGdib29zdCkNCg0Kc2hvd19iZXN0KGN2X3Jlc194Z2Jvb3N0KQ0KDQpgYGANCg0KVGhlIGJlc3QgaGVyZSBpcyBzdGlsbCBkaXNjb3VyYWdpbmcuIFRoaXMgZmlndXJlIGlzIGxpa2VseSBtb3JlIHJvYnVzdCBhbmQgYSBiZXR0ZXIgZXN0aW1hdGUgb2YgcGVyZm9ybWFuY2Ugb24gaG9sZG91dCBkYXRhLiBMZXQncyBmaXQgb24gdGhlIGVudGlyZSB0cmFpbmluZyBzZXQgYXQgdGhlc2UgaHlwZXJwYXJhbWV0ZXJzIHRvIGdldCBhIHNpbmdsZSBwZXJmb3JtYW5jZSBlc3RpbWF0ZSBvbiB0aGUgYmVzdCBtb2RlbCBzbyBmYXIuDQoNCmBgYHtyIGZpdCB4Z2Jvb3N0IHR3byBhbmQgcGVyZm9ybWFuY2V9DQp4Z2Jfd2ZfYmVzdCA8LSAgIA0KICB3b3JrZmxvdygpICU+JSANCiAgYWRkX3JlY2lwZShhZHZhbmNlZF9yZWMpICU+JSANCiAgYWRkX21vZGVsKHhnYm9vc3Rfc3BlYykgJT4lIA0KICBmaW5hbGl6ZV93b3JrZmxvdyhzZWxlY3RfYmVzdChjdl9yZXNfeGdib29zdCkpDQoNCmZpdF9iZXN0IDwtIHhnYl93Zl9iZXN0ICU+JQ0KICBwYXJzbmlwOjpmaXQoZGF0YSA9IHRyYWluX2RmKQ0KDQphdWdtZW50KGZpdF9iZXN0LCB0cmFpbl9kZikgJT4lIA0KICBzZWxlY3QoaXNfaG9tZV9ydW4sIC5wcmVkX3llcykgJT4lIA0KICBtbl9sb2dfbG9zcyh0cnV0aCA9IGlzX2hvbWVfcnVuLCBlc3RpbWF0ZSA9IC5wcmVkX3llcywgZXZlbnRfbGV2ZWwgPSAic2Vjb25kIikNCg0KYGBgDQoNCiMgey19DQoNCi0tLS0NCg0KIyMgVmFyaWFibGUgSW1wb3J0YW5jZQ0KDQpMZXQncyB0YWtlIGEgZGVlcGVyIGRpdmUgaW50byB0aGUgWEdCb29zdCB2YXJpYWJsZSBpbXBvcnRhbmNlLg0KDQpgYGB7ciB2YXJpYWJsZSBpbXBvcnRhbmNlIHhnYm9vc3QgdHdvfQ0KZml0X2Jlc3QgJT4lIA0KICBleHRyYWN0X2ZpdF9wYXJzbmlwKCkgJT4lIA0KICB2aXAoZ2VvbSA9ICJwb2ludCIsIG51bV9mZWF0dXJlcyA9IDE1KSArDQogIGxhYnModGl0bGUgPSAiWEdCb29zdCBtb2RlbCBWYXJpYWJsZSBJbXBvcnRhbmNlIiwNCiAgICAgICBzdWJ0aXRsZSA9ICJWSVAgcGFja2FnZSIpDQoNCmBgYA0KDQojIyBEQUxFWCBQYXJ0aWFsIERlcGVuZGVuY2UgUGxvdHMNCg0KV2hhdCBpcyB0aGUgYWdncmVnYXRlZCBlZmZlY3Qgb2YgdGhlIGBsYXVuY2hfYW5nbGVgIGZlYXR1cmUgb3ZlciA1MDAgZXhhbXBsZXM/DQoNCmBgYHtyIHhnYm9vc3QgdHdvIERBTEVYIHJlbGVhc2VfeWVhcn0NCmV4cGxhaW5lcl94Z2IgPC0gZXhwbGFpbl90aWR5bW9kZWxzKA0KICBmaXRfYmVzdCwNCiAgdHJhaW5fZGYgJT4lIHNlbGVjdCgtaXNfaG9tZV9ydW4pLA0KICBhcy5udW1lcmljKHRyYWluX2RmJGlzX2hvbWVfcnVuKQ0KKQ0KDQpwZHBfYW5nbGUgPC0gbW9kZWxfcHJvZmlsZShleHBsYWluZXJfeGdiLA0KICAgICAgICAgICAgICBOID0gNTAwLA0KICAgICAgICAgICAgICB2YXJpYWJsZXMgPSAibGF1bmNoX2FuZ2xlIikNCg0KYXNfdGliYmxlKHBkcF9hbmdsZSRhZ3JfcHJvZmlsZXMpICU+JSANCiAgZ2dwbG90KGFlcyhgX3hfYCwgYF95aGF0X2ApKSArDQogIGdlb21fbGluZShkYXRhID0gYXNfdGliYmxlKA0KICAgICBwZHBfYW5nbGUkY3BfcHJvZmlsZXMpLA0KICAgICBhZXMobGF1bmNoX2FuZ2xlLCBncm91cCA9IGBfaWRzX2ApLA0KICAgICBzaXplID0gMC41LCBhbHBoYSA9IDAuMSwgY29sb3IgPSAiZ3JheTMwIg0KICAgKSArDQogIGdlb21fbGluZShzaXplID0gMS4yLCBhbHBoYSA9IDAuOCwgY29sb3IgPSAib3JhbmdlIikgKw0KICBsYWJzKHggPSAiTGF1bmNoIEFuZ2xlIiwgeSA9ICJQcmVkaWN0ZWQgSG9tZSBSdW5zIikNCiAgDQpgYGANCg0KV2hhdCBpcyB0aGUgYWdncmVnYXRlZCBlZmZlY3Qgb2YgdGhlIGBsYXVuY2hfc3BlZWRgIGZlYXR1cmUgb3ZlciA1MDAgZXhhbXBsZXM/DQoNCmBgYHtyIHhnYm9vc3QgdHdvIERBTEVYIGZvbGxvd2Vyc30NCnBkcF9zcGVlZCA8LSBtb2RlbF9wcm9maWxlKGV4cGxhaW5lcl94Z2IsDQogICAgICAgICAgICAgIE4gPSA1MDAsDQogICAgICAgICAgICAgIHZhcmlhYmxlcyA9ICJsYXVuY2hfc3BlZWQiKQ0KDQphc190aWJibGUocGRwX3NwZWVkJGFncl9wcm9maWxlcykgJT4lIA0KICBnZ3Bsb3QoYWVzKGBfeF9gLCBgX3loYXRfYCkpICsNCiAgZ2VvbV9saW5lKGRhdGEgPSBhc190aWJibGUoDQogICAgIHBkcF9zcGVlZCRjcF9wcm9maWxlcyksDQogICAgIGFlcyhsYXVuY2hfc3BlZWQsIGdyb3VwID0gYF9pZHNfYCksDQogICAgIHNpemUgPSAwLjUsIGFscGhhID0gMC4xLCBjb2xvciA9ICJncmF5MzAiDQogICApICsNCiAgZ2VvbV9saW5lKHNpemUgPSAxLjIsIGFscGhhID0gMC44LCBjb2xvciA9ICJkYXJrYmx1ZSIpICsNCiAgbGFicyh4ID0gIkxhdW5jaCBTcGVlZCIsIHkgPSAiUHJlZGljdGVkIEhvbWUgUnVucyIpDQogIA0KYGBgDQoNCldlJ3JlIG91dCBvZiB0aW1lLiBUaGlzIHdpbGwgYmUgYXMgZ29vZCBhcyBpdCBnZXRzLiBPdXIgZmluYWwgc3VibWlzc2lvbjoNCg0KTGV0J3MgcG9zdCB0aGlzIGZpbmFsIHN1Ym1pc3Npb24gdG8gS2FnZ2xlLg0KDQpgYGB7ciB3cml0ZSB4Z2Jvb3N0IHR3bywgZXZhbCA9IEZBTFNFfQ0Kc3VibWlzc2lvbiA8LSBhdWdtZW50KGZpdF9iZXN0LCBob2xkb3V0X2RmKSAlPiUgDQogIHNlbGVjdChiaXBfaWQsIGlzX2hvbWVfcnVuID0gLnByZWRfeWVzKSANCg0Kd3JpdGVfY3N2KHN1Ym1pc3Npb24sIGZpbGUgPSBwYXRoX2V4cG9ydCkNCmBgYA0KDQpgYGB7ciBzdWJtaXQgeGdib29zdCB0d28sIGV2YWwgPSBGQUxTRX0NCnNoZWxsKGdsdWU6OmdsdWUoJ2thZ2dsZSBjb21wZXRpdGlvbnMgc3VibWl0IC1jIHsgY29tcGV0aXRpb25fbmFtZSB9IC1mIHsgcGF0aF9leHBvcnQgfSAtbSAiRmluYWwgbW9kZWwiJykpDQpgYGANCg0KDQoNCg==

Sliced Baseball Home Runs

Jim Gruman

July 27, 2021

Get the Data

Outcome Variable Distribution

Time series

Machine Learning: Random Forest

The recipe

Dataset for modeling

Cross Validation

Model Specification

Parallel backend

Fit and Variable Importance

Machine Learning: XGBoost Model 1

Model Specification

Tuning and Performance

Machine Learning: XGBoost Model 2

Advanced Recipe

Model Specification

Tuning and Performance

Variable Importance

DALEX Partial Dependence Plots