Приймання аргументів командного рядка
Створімо новий проєкт за допомогою, як завжди, cargo new
. Ми назвемо наш проєкт minigrep
, щоб вирізнити його від інструменту grep
, що вже може бути встановлено у вашій системі.
$ cargo new minigrep
Created binary (application) `minigrep` project
$ cd minigrep
Перше завдання - зробити, щоб minigrep
приймав два аргументи командного рядка: шлях до файлу і стрічку для пошуку. Тобто ми хочемо, щоб нашу програму можна було запускати за допомогою cargo run
, двох рисок на позначення що подальші аргументи стосуються нашої програми, а не cargo
, стрічки для пошуку і шляху до файлу, в якому треба шукати, ось так:
$ cargo run -- searchstring example-filename.txt
Наразі програма, створена cargo new
, не може обробляти аргументи, передані їй. Певні бібліотеки з crates.io можуть допомогти писати програму, що приймає аргументи командного рядка, але оскільки ви лише вивчаєте цю концепцію, запровадимо цю можливість самостійно.
Читання значень параметрів
Щоб дозволити minigrep
читати значення аргументів командного рядка, переданих йому, нам знадобиться функція std::env::args
зі стандартної бібліотеки Rust. Ця функція поверне ітератор аргументів командного рядка, переданих minigrep
. Повніше про ітератори піде у Розділі 13. Поки що вам лише треба знати про ітератори дві речі: ітератори створюють послідовність значень, і ми можемо викликати метод
collect
для ітератора, щоб перетворити його на колекцію, таку як вектор, що міститиме всі елементи, створені ітератором.
collect
method on an iterator to turn it into a collection, such as a vector, that contains all the elements the iterator produces.
Файл: src/main.rs
use std::env; fn main() { let args: Vec<String> = env::args().collect(); dbg!(args); }
Спершу ми вводимо модуль std::env
до області видимості за допомогою інструкції use
, щоб можна було скористатися функцію args
з цього модуля. Зверніть увагу, що функція std::env::args
вкладена у два рівні модулів. Як ми вже говорили у Розділі 7, у випадках, коли потрібна функція, вкладена глибше одного модуля, краще ввести в область видимості її батьківський модуль, аніж саму функцію. Таким чином, ми зможемо легко використовувати інші функції з std::env
. Також це дещо менш двозначне, ніж додавання use std::env::args
і виклик функції як просто args
, бо просто args
можна легко переплутати з функцією, визначеною в поточному модулі.
Функція
args
і некоректний юнікодЗверніть увагу, що
std::env::args
запанікує, якщо якийсь із аргументів містить некоректний юнікод. Якщо вашій програмі треба приймати аргументи з некоректним юнікодом, скористайтеся натомість функцієюstd::env::args_os
. Вона повертає ітератор, що створює значенняOsString
замістьString
. Ми вирішили скористатисяstd::env::args
для простоти, бо значенняOsString
різняться між платформами і з ними складніше працювати, ніж зіString
.
У першому рядку main
ми викликаємо env::args
і одразу ж використовуємо collect
, щоб перетворити ітератор на вектор, що містить усі значення, вироблені ітератором. Ми можемо використати функцію collect
, щоб створити багато видів колекцій, тому явно позначаємо тип args
, щоб вказати, що нам потрібен вектор стрічок. Хоча в Rust дуже нечасто треба позначати типи, collect
є однією з функцій, яка часто потребує анотацій, бо Rust неспроможний вивести потрібний тип колекції.
В кінці ми виводимо вектор за допомогою макросу для зневаджування. Спробуймо тепер запустити код спершу без аргументів, а тоді з двома аргументами:
$ cargo run
Compiling minigrep v0.1.0 (file:///projects/minigrep)
Finished dev [unoptimized + debuginfo] target(s) in 0.61s
Running `target/debug/minigrep`
[src/main.rs:5] args = [
"target/debug/minigrep",
]
$ cargo run -- needle haystack
Compiling minigrep v0.1.0 (file:///projects/minigrep)
Finished dev [unoptimized + debuginfo] target(s) in 1.57s
Running `target/debug/minigrep needle haystack`
[src/main.rs:5] args = [
"target/debug/minigrep",
"needle",
"haystack",
]
Зверніть увагу, що перше значення у векторі - "target/debug/minigrep"
, тобто назва нашого двійкового файлу. Це відповідає поведінці списку параметрів у C, що дозволяє програмам використовувати ім'я, за яким їх викликано, під час виконання. Часто буває зручно мати доступ до імені програми, якщо ви хочете вивести його у повідомленнях чи змінити поведінку програми залежно від того, який псевдонім був використаний у командному рядку для запуску програми. Але задля потреб нашого розділу ми пропустимо його і збережемо лише два потрібні параметри.
Збереження значень параметрів у змінних
Програма вже може отримати значення, задані аргументами командного рядка. Тепер нам треба зберегти значення двох аргументів у змінних, щоб можна було використати ці значення далі в програмі. Це ми робимо у Блоці коду 12-2.
Файл: src/main.rs
use std::env;
fn main() {
let args: Vec<String> = env::args().collect();
let query = &args[1];
let file_path = &args[2];
println!("Searching for {}", query);
println!("In file {}", file_path);
}
Як ми бачили, коли виводили вектор, ім'я програми займає перше значення у векторі за індексом args[0]
, тому ми починаємо аргументи з індексу 1
. Перший аргумент, що приймає minigrep
- це шукана стрічка, тож ми розміщуємо посилання на перший аргумент у змінній query
. Другий аргумент буде шляхом до файлу, тож ми розміщуємо посилання на другий аргумент у змінній file_path
.
Ми тимчасово виводимо значення цих змінних, щоб підтвердити, що код працює, як ми очікували. Запустімо цю програму знову з аргументами test
і sample.txt
:
$ cargo run -- test sample.txt
Compiling minigrep v0.1.0 (file:///projects/minigrep)
Finished dev [unoptimized + debuginfo] target(s) in 0.0s
Running `target/debug/minigrep test sample.txt`
Searching for test
In file sample.txt
Чудово, програма працює! Значення потрібних нам аргументів зберігаються у правильних змінних. Пізніше ми додамо трохи обробки помилок, щоб розібратися з певними потенційними помилковими ситуаціями, на кшталт коли користувач не надає жодних параметрів; а поки що ігноруватимемо цю ситуацію і натомість займемося додаванням можливостей для читання файлів.