Integracja Fivetran
  • 03 Nov 2023
  • 2 Minuty do przeczytania
  • Współtwórcy

Integracja Fivetran


Article Summary

Usprawnij inżynierię danych Tulip dzięki integracji z Fivetran

Cel

Usprawnienie potoków inżynierii danych z Tulip umożliwia korzystanie z danych tabel Tulip w całym przedsiębiorstwie.

Konfiguracja

Do konfiguracji wymagane są następujące elementy: * Konto Fivetran (dostępna jest wersja bezpłatna) * AWS (lub inne konto w chmurze) * Baza danych lub hurtownia danych do odbierania danych z tabel Tulip * Wysoki poziom znajomości języka Python.

Jak to działa

Konfiguracja automatyzacji Fivetran obejmuje następujące kroki:

  1. Konfiguracja konta Fivetran
  2. Utwórz miejsce docelowe (np. Snowflake)
  3. Utworzenie funkcji Connector z funkcją AWS Lambda
  4. Utwórz funkcję AWS Lambda
  5. Sfinalizowanie funkcji Connector
  6. Przetestowanie konektora Fivetran i dostosowanie częstotliwości odświeżania

Fivetran używa funkcji lambda do automatycznego pobierania danych z tabel tulipanów zgodnie z harmonogramem i aktualizowania docelowych baz danych lub hurtowni danych. Dołączony przykład to prosta funkcja, która ponownie zapisuje tabelę z nowymi, odświeżonymi danymi. Dodatkowe funkcje można dodać w celu ulepszenia wyzwalaczy opartych na zdarzeniach.

Instrukcje konfiguracji

Konfiguracja konta Fivetran

Najpierw należy skonfigurować konto Fivetran. Oferują oni darmową wersję z ograniczoną liczbą odświeżeń miesięcznie

Konfiguracja miejsca docelowego

Następnie kliknij Destinations i utwórz pierwsze miejsce docelowe. Jest to zasadniczo baza danych lub hurtownia danych, która będzie odbierać dane z tabel Tulip.image.png

Utwórz funkcję łącznika

Następnie utwórz funkcję łącznika; jest to proces automatyzacji potoku danych z Tulip. Możesz użyć dowolnej funkcji w chmurze, takiej jak AWS Lambda, Azure Functions lub GCP Cloud Functions. W tym przykładzie użyjemy AWS Lambdaimage.png

Postępuj zgodnie z instrukcjami in-Fivetran, aby utworzyć funkcję Lambda na AWS z odpowiednimi rolami i uprawnieniamiZobacz link do szablonu funkcji lambda jako punkt wyjściaPoniżej znajduje się kilka pomocnych wskazówek:

  • Będziesz musiał utworzyć dwie warstwy: jedną dla biblioteki tulip, drugą dla biblioteki pandas.
  • Będziesz musiał dodać instancję, klucz API i sekret API jako zmienne środowiskowe do funkcji lambda. Może być konieczne zaktualizowanie ustawień uruchamiania, aby zwiększyć czas oczekiwania i używaną pamięć. Poniższy zrzut ekranu przedstawia aktualizację konfiguracjiimage.png

Następne kroki

Po uruchomieniu funkcji konektora można dostosować częstotliwość odświeżania, wyświetlić informacje o tabelach Tulip w docelowej bazie danych lub hurtowni danych i uzyskać dodatkowe funkcje

Niektóre konkretne przypadki użycia tego potoku danych: * Analityka na poziomie przedsiębiorstwa i przetwarzanie danych Tulip * Automatyzacja wsadowa z systemami korporacyjnymi * Kontekstualizacja z hurtowniami danych i jeziorami danych

Dodatkowe zasoby

Skontaktuj się z firmą Fivetran, aby uzyskaćdodatkowe wsparcie tutajSkontaktuj sięz firmą Fivetran, aby uzyskać dodatkowe wsparcie tutaj * Dodatkowo udostępniono formularz do wprowadzania korekt i żądań uproszczonej integracji tabel Tulip. Prześlij opinię i prośbę tutaj


Czy ten artykuł był pomocny?