Before you begin
- Labs create a Google Cloud project and resources for a fixed time
- Labs have a time limit and no pause feature. If you end the lab, you'll have to restart from the beginning.
- On the top left of your screen, click Start lab to begin
Image understanding across multiple images
/ 25
Similarity/Differences between the images
/ 25
Generate a video description and retrieve extra information beyond the video
/ 25
Multimodal retrieval augmented generation (RAG)
/ 25
Практична робота підвищеного рівня складності передбачає сценарій і кілька завдань. Покрокових інструкцій немає. Натомість ви маєте застосувати навички, які здобули під час практичних робіт курсу, і самостійно з’ясувати, як виконувати завдання. Автоматична система оцінювання (показана на цій сторінці) згенерує відгук щодо того, чи правильно виконано завдання.
Під час практичної роботи підвищеного рівня складності ви не вивчаєте нові поняття Google Cloud, а розвиваєте опановані навички (наприклад, змінюєте значення за умовчанням і переглядаєте повідомлення про помилки для їх виправлення).
Щоб набрати 100%, слід правильно виконати всі завдання за визначений період часу.
Це практичне заняття рекомендовано для слухачів, які зареєструвалися на кваліфікаційний курс Аналіз мультимедійних документів за допомогою мультимодального Gemini і технології мультимодальної генерації з доповненням через пошук (RAG). Готові почати?
Ознайомтеся з наведеними нижче вказівками. На виконання практичного заняття відводиться обмежений час, і його не можна призупинити. Щойно ви натиснете Почати заняття, з’явиться таймер, який показуватиме, скільки часу для роботи з ресурсами Google Cloud у вас залишилося.
Ви зможете виконати практичне заняття в дійсному робочому хмарному середовищі (не в симуляції або демонстраційному середовищі). Для цього на час практичного заняття вам надаються тимчасові облікові дані для реєстрації і входу в Google Cloud.
Для цього практичного заняття потрібно мати:
У меню навігації () консолі Google Cloud натисніть Vertex AI > Workbench.
Знайдіть екземпляр
Інтерфейс JupyterLab для екземпляра Workbench відкриється в новій вкладці вебпереглядача.
1. Закрийте вкладку вебпереглядача з інтерфейсом JupyterLab і поверніться на головну сторінку Workbench.
2. Поставте прапорець біля назви екземпляра й натисніть Reset (Скинути).
3. Коли кнопка Open JupyterLab (Відкрити JupyterLab) знову стане активною, зачекайте одну хвилину, перш ніж натиснути її.
Відкрийте файл
У вікні Select Kernel (Вибрати ядро) виберіть у списку доступних ядер опцію Python 3.
Запустіть розділ блокнота Getting Started. Ідентифікатор проекту та місцезнаходження попередньо налаштовані для вас.
Перш ніж переходити до Завдання 1, запустіть код у чотирьох клітинках із розділу записника Налаштування й вимоги.
Ви є координатором маркетингових кампаній у медіакомпанії і працюєте в команді з менеджером із маркетингу. Разом ви плануєте, проводите й оцінюєте кампанії, щоб досягти цільових показників продажів. Нещодавно ваша організація уклала важливий контракт із Google. Тепер ви хочете докладно ознайомитися з матеріалами, які допоможуть якнайшвидше дізнатися більше про бренд Google і його індивідуальність. Щоб отримати докладну інформацію про діяльність компанії, ви плануєте переглянути її правила щодо фірмового оформлення, відгуки клієнтів, фінансові звіти, матеріали попередніх кампаній і оголошення про продукти. Ви маєте намір скористатися інноваційними можливостями Gemini, які допоможуть вам розібратися в деталях.
Під час цього практичного заняття ви спершу створите мультимодальні запити, щоб отримати інформацію з текстових, графічних і відеоданих, згенеруєте опис відео й знайдете додаткові відомості в ролику за допомогою мультимодального Gemini. Ви також створите метадані документів, що містять текст і зображення, знайдете необхідні фрагменти тексту й виведете цитати, використовуючи технологію мультимодальної генерації з доповненням через пошук від Gemini.
Під час виконання цього завдання ви ознайомитеся з брендом Google і його індивідуальністю, використовуючи Gemini – мультимодальну модель, яка підтримує мультимодальні запити. Ви додасте в запити фрагменти тексту, зображення й відео, щоб отримати відповіді у вигляді тексту або коду.
Щоб успішно виконати це завдання, дотримуйтеся вказівок у відповідних розділах записника.
Щоб підтвердити виконання завдання, натисніть Підтвердити виконання.
Щоб підтвердити виконання завдання, натисніть Підтвердити виконання.
Щоб згенерувати опис відео за допомогою мультимодальної моделі, виконайте вказівки в розділі Згенеруйте опис відео.
Щоб отримати теги об’єктів із відео за допомогою мультимодальної моделі, виконайте вказівки в розділі Отримайте теги об’єктів із відео.
Щоб отримати додаткову інформацію про відео за допомогою мультимодальної моделі, виконайте вказівки в розділі Поставте додаткові запитання щодо відео.
Щоб отримати додаткову інформацію із зображень за допомогою мультимодальної моделі, виконайте вказівки в розділі Отримайте додаткові дані з ролика.
Щоб підтвердити виконання завдання, натисніть Підтвердити виконання.
Щоб успішно виконати це завдання, дотримуйтеся вказівок у відповідних розділах записника.
Доступні дані й допоміжні функції для Завдання 2:
Умови використання сервісів Google, які визначають відносини між компанією Google і її користувачами. Цей документ містить інформацію про те, чого користувачі можуть очікувати від Google, а також про правила використання наших сервісів, права інтелектуальної власності на контент і процедури вирішення спорів і суперечок. Ця версія документа містить лише текст.
Скорочена версія документа Google-10K, який містить докладний огляд фінансових показників компанії, а також її комерційної діяльності, процедур керування й факторів ризику. Через великий обсяг оригінального документа в завданні використовується скорочена версія із 14 сторінок, поділена на Частину 1 і Частину 2. Окрім тексту, ця версія містить зображення (зокрема таблиці, діаграми й графіки).
Щоб виконувати завдання, вам також потрібно скористатися допоміжними функціями зі списку нижче. Докладніше про ці функції можна дізнатися в цій статті на GitHub.
Аналіз метаданих обробленого тексту
Аналіз метаданих обробленого зображення
Імпорт допоміжних функцій для застосування технології генерації з доповненням через пошук
get_similar_text_from_query().Щоб імпортувати й запустити допоміжні функції, виконайте вказівки в розділі Створіть метадані документів, які містять текст і зображення.
Щоб працювати із зазначеними змінними, виконайте вказівки в розділі Створіть запит користувача.
Щоб отримати необхідні фрагменти тексту на основі запиту, виконайте вказівки в розділі Отримайте необхідні фрагменти тексту.
Щоб упорядкувати фрагменти тексту, виконайте вказівки в розділі Створіть контекст.
Щоб надіслати контекст у Gemini і згенерувати відповідь, виконайте вказівки в розділі Надішліть контекст у Gemini.
Щоб підтвердити виконання завдання, натисніть Підтвердити виконання.
Пройшовши це заняття підвищеного рівня складності, ви успішно продемонстрували вміння користуватися інтерфейсами Gemini API для генерування тексту, створення викликів функцій і опису відеоконтенту. Перш ніж застосовувати функції на практиці, ви переконалися, що вони відповідають установленим стандартам. Гарний результат!
Щоб дізнатися більше про Gemini, перегляньте наведені нижче ресурси.
…допомагають ефективно використовувати технології Google Cloud. Наші курси передбачають опанування технічних навичок, а також ознайомлення з рекомендаціями, що допоможуть вам швидко зорієнтуватися й вивчити матеріал. Ми пропонуємо курси різних рівнів – від базового до високого. Ви можете вибрати формат навчання (за запитом, онлайн або офлайн) відповідно до власного розкладу. Пройшовши сертифікацію, ви перевірите й підтвердите свої навички та досвід роботи з технологіями Google Cloud.
Посібник востаннє оновлено 15 жовтня 2025 року
Практичне заняття востаннє протестовано 15 жовтня 2025 року
© Google LLC 2025. Усі права захищено. Назва та логотип Google є торговельними марками Google LLC. Усі інші назви компаній і продуктів можуть бути торговельними марками відповідних компаній, з якими вони пов’язані.
This content is not currently available
We will notify you via email when it becomes available
Great!
We will contact you via email if it becomes available
One lab at a time
Confirm to end all existing labs and start this one