Приймання аргументів командного рядка

Створімо новий проєкт за допомогою, як завжди, cargo new. Ми назвемо наш проєкт minigrep, щоб вирізнити його від інструменту grep, що вже може бути встановлено у вашій системі.

$ cargo new minigrep
     Created binary (application) `minigrep` project
$ cd minigrep

Перше завдання - зробити, щоб minigrep приймав два аргументи командного рядка: шлях до файлу і стрічку для пошуку. Тобто ми хочемо, щоб нашу програму можна було запускати за допомогою cargo run, двох рисок на позначення що подальші аргументи стосуються нашої програми, а не cargo, стрічки для пошуку і шляху до файлу, в якому треба шукати, ось так:

$ cargo run -- searchstring example-filename.txt

Наразі програма, створена cargo new, не може обробляти аргументи, передані їй. Певні бібліотеки з crates.io можуть допомогти писати програму, що приймає аргументи командного рядка, але оскільки ви лише вивчаєте цю концепцію, запровадимо цю можливість самостійно.

Читання значень параметрів

Щоб дозволити minigrep читати значення аргументів командного рядка, переданих йому, нам знадобиться функція std::env::args зі стандартної бібліотеки Rust. Ця функція поверне ітератор аргументів командного рядка, переданих minigrep. Повніше про ітератори піде у Розділі 13. Поки що вам лише треба знати про ітератори дві речі: ітератори створюють послідовність значень, і ми можемо викликати метод

collect для ітератора, щоб перетворити його на колекцію, таку як вектор, що міститиме всі елементи, створені ітератором.

collect method on an iterator to turn it into a collection, such as a vector, that contains all the elements the iterator produces.

Файл: src/main.rs

use std::env;

fn main() {
    let args: Vec<String> = env::args().collect();
    dbg!(args);
}

Listing 12-1: Collecting the command line arguments into a vector and printing them

Спершу ми вводимо модуль std::env до області видимості за допомогою інструкції use, щоб можна було скористатися функцію args з цього модуля. Зверніть увагу, що функція std::env::args вкладена у два рівні модулів. Як ми вже говорили у Розділі 7, у випадках, коли потрібна функція, вкладена глибше одного модуля, краще ввести в область видимості її батьківський модуль, аніж саму функцію. Таким чином, ми зможемо легко використовувати інші функції з std::env. Також це дещо менш двозначне, ніж додавання use std::env::args і виклик функції як просто args, бо просто args можна легко переплутати з функцією, визначеною в поточному модулі.

Функція args і некоректний юнікод

Зверніть увагу, що std::env::args запанікує, якщо якийсь із аргументів містить некоректний юнікод. Якщо вашій програмі треба приймати аргументи з некоректним юнікодом, скористайтеся натомість функцією std::env::args_os. Вона повертає ітератор, що створює значення OsString замість String. Ми вирішили скористатися std::env::args для простоти, бо значення OsString різняться між платформами і з ними складніше працювати, ніж зі String.

У першому рядку main ми викликаємо env::args і одразу ж використовуємо collect, щоб перетворити ітератор на вектор, що містить усі значення, вироблені ітератором. Ми можемо використати функцію collect, щоб створити багато видів колекцій, тому явно позначаємо тип args, щоб вказати, що нам потрібен вектор стрічок. Хоча в Rust дуже нечасто треба позначати типи, collect є однією з функцій, яка часто потребує анотацій, бо Rust неспроможний вивести потрібний тип колекції.

В кінці ми виводимо вектор за допомогою макросу для зневаджування. Спробуймо тепер запустити код спершу без аргументів, а тоді з двома аргументами:

$ cargo run
   Compiling minigrep v0.1.0 (file:///projects/minigrep)
    Finished dev [unoptimized + debuginfo] target(s) in 0.61s
     Running `target/debug/minigrep`
[src/main.rs:5] args = [
    "target/debug/minigrep",
]
$ cargo run -- needle haystack
   Compiling minigrep v0.1.0 (file:///projects/minigrep)
    Finished dev [unoptimized + debuginfo] target(s) in 1.57s
     Running `target/debug/minigrep needle haystack`
[src/main.rs:5] args = [
    "target/debug/minigrep",
    "needle",
    "haystack",
]

Зверніть увагу, що перше значення у векторі - "target/debug/minigrep", тобто назва нашого двійкового файлу. Це відповідає поведінці списку параметрів у C, що дозволяє програмам використовувати ім'я, за яким їх викликано, під час виконання. Часто буває зручно мати доступ до імені програми, якщо ви хочете вивести його у повідомленнях чи змінити поведінку програми залежно від того, який псевдонім був використаний у командному рядку для запуску програми. Але задля потреб нашого розділу ми пропустимо його і збережемо лише два потрібні параметри.

Збереження значень параметрів у змінних

Програма вже може отримати значення, задані аргументами командного рядка. Тепер нам треба зберегти значення двох аргументів у змінних, щоб можна було використати ці значення далі в програмі. Це ми робимо у Блоці коду 12-2.

Файл: src/main.rs

use std::env;

fn main() {
    let args: Vec<String> = env::args().collect();

    let query = &args[1];
    let file_path = &args[2];

    println!("Searching for {}", query);
    println!("In file {}", file_path);
}

Listing 12-2: Creating variables to hold the query argument and file path argument

Як ми бачили, коли виводили вектор, ім'я програми займає перше значення у векторі за індексом args[0], тому ми починаємо аргументи з індексу 1. Перший аргумент, що приймає minigrep - це шукана стрічка, тож ми розміщуємо посилання на перший аргумент у змінній query. Другий аргумент буде шляхом до файлу, тож ми розміщуємо посилання на другий аргумент у змінній file_path.

Ми тимчасово виводимо значення цих змінних, щоб підтвердити, що код працює, як ми очікували. Запустімо цю програму знову з аргументами test і sample.txt:

$ cargo run -- test sample.txt
   Compiling minigrep v0.1.0 (file:///projects/minigrep)
    Finished dev [unoptimized + debuginfo] target(s) in 0.0s
     Running `target/debug/minigrep test sample.txt`
Searching for test
In file sample.txt

Чудово, програма працює! Значення потрібних нам аргументів зберігаються у правильних змінних. Пізніше ми додамо трохи обробки помилок, щоб розібратися з певними потенційними помилковими ситуаціями, на кшталт коли користувач не надає жодних параметрів; а поки що ігноруватимемо цю ситуацію і натомість займемося додаванням можливостей для читання файлів.