POMOC: Hadoop - DUŻE dane
#15

hawthorne napisał: Do celów uczenia się wystarczy 4-węzłowy klaster Hadoop, aby rozpocząć pisanie zadań MapReduce lub eksplorację gałęzi, świń lub HBase. Patrzę z perspektywy branży, w której jesteśmy zainteresowani zebraniem ogromnej ilości danych. Aby zobaczyć możliwości Hadoop w tym prawdziwym problemie, potrzebna będzie spora klaster. 500 węzłów jest obliczanych na podstawie ilości danych, które próbujesz rozbić, oraz czasu potrzebnego na zwrócenie wyników. Klastry Hadoop nie są tak kosztowne. komputery stacjonarne są wystarczające do działania jako węzły obliczeniowe (chociaż branża preferuje węzły klasy serwerowej). Głównym wyzwaniem są nadal nieruchomości. Gdzie zamierzasz umieścić swój klaster? Jak zapewnić skuteczne chłodzenie itp Masz rację co do wielkości, pod warunkiem, że masz na myśli rozwiązanie problemu przemysłowego, to powiem dowolny rozmiar, o ile możesz uzasadnić moc obliczeniową klastra wielkością problemu, który próbujesz rozwiązać. Ale jeśli mnie zapytasz, nie przejmuję się zbytnio nieruchomościami, aby wdrożyć klaster hadoop od 500 do 1000 węzłów. Po pierwsze, bądźmy realistami. Jeśli płacisz dobre pieniądze, aby rozwiązać problem przemysłowy, który będzie wymagał 500 węzłów, nie będziesz używać pulpitu. Właśnie dlatego tworzone są systemy typu blade, dlatego tworzone są serwery rackowe. Singapur to kropka na mapie globalnej, a nie kropka na kawałku papieru formatu A4. Centra danych, na które natknąłem się w samym parku naukowym Cintech 1, są w stanie pomieścić ponad 500 węzłów. Wyzwanie jest w rzeczywistości związane z infrastrukturą sieciową, posiadanie 500 węzłów będzie bardzo wymagające dla infrastruktury sieciowej. Mówi się, że nauka o rakietach nie jest też gospodarzem dla 500 węzłów. Myślę, że musimy tu być realistami. To, że Hadoop może być hostowany na sprzęcie towarowym, nie oznacza, że tak musi być. Przy 500 węzłach wątpię, czy Twój sprzęt towarowy da ci najlepszy huk za dolara. Będziesz musiał zmierzyć się z wymianą sprzętu i wieloma problemami operacyjnymi, starając się utrzymać 500 węzłów w doskonałym stanie. Musisz mieć sprzęt monitorujący, taki jak HP Lightsout, Dell iDRAC itp., Aby ułatwić monitorowanie i zdalne zarządzanie. Jeśli mam poradzić sobie z 500 fizycznymi systemami, nie ma mowy, żebym użył obudowy typu desktop / cokół, marnując miejsce. Wątpię, czy użyję twardego dysku wdrożonego na każdym serwerze, marnując czas na problemy operacyjne. Wolę kilka dużych sieci SAN z tymi wszystkimi bezdyskowymi serwerami połączonymi za pośrednictwem Infiniband, sieci 10 Gbs lub światłowodów. W ten sposób mogę zrobić miejsce dla serwerów tylko 1U. Wystarczy hostować nieco więcej niż 10 x szafy 42U, aby mieć 500 fizycznych węzłów. W rzeczywistości, jeśli zamierzam używać serwerów typu blade, mogę obsługiwać jeszcze większą gęstość. Korzystając z serwerów kasetowych IBM, które można znaleźć pod adresem http://www-03.ibm.com/systems/bladec...dware/chassis/, potrzebuję tylko szafy 10x 42U do hostowania 560 węzłów fizycznych w szafach 10x 42U z odstępami 5U pomiędzy nimi gniazdo w KVM, przełączniki i okablowanie w każdej szafie. Ale oczywiście wiem, że serwery typu blade są naprawdę szkodliwe dla centrum danych bez odpowiedniego systemu chłodzenia. Pamiętam, że wcześniej odwiedzałem pokojowe centrum danych w Internecie, jest bardzo zimno, więc tak naprawdę nie martwię się o systemy chłodzenia. Skuteczne chłodzenie dla 500 węzłów nie stanowi przełomu. Jeśli Amazon może obsługiwać AWS w Singapurze, 500 węzłów mieści się w limitach. W rzeczywistości, jeśli głównym celem jest rozwiązanie problemu, zamiast próbować dowiedzieć się, jak duży klaster można zbudować, wówczas sensowne jest używanie dobrych maszyn o dobrych specyfikacjach do uruchamiania klastra.
Reply


Messages In This Thread
POMOC: Hadoop - DUŻE dane - by rj_2414 - 25 Feb 2020, 12:02 AM
RE: POMOC: Hadoop - DUŻE dane - by canadaa50 - 25 Feb 2020, 12:04 AM
RE: POMOC: Hadoop - DUŻE dane - by mmonnen - 25 Feb 2020, 12:07 AM
RE: POMOC: Hadoop - DUŻE dane - by poreb1a.k - 25 Feb 2020, 12:10 AM
RE: POMOC: Hadoop - DUŻE dane - by qazster2005 - 25 Feb 2020, 12:13 AM
RE: POMOC: Hadoop - DUŻE dane - by elnik73.2 - 25 Feb 2020, 12:16 AM
RE: POMOC: Hadoop - DUŻE dane - by clintonch - 25 Feb 2020, 12:19 AM
RE: POMOC: Hadoop - DUŻE dane - by miczax - 25 Feb 2020, 12:22 AM
RE: POMOC: Hadoop - DUŻE dane - by icedragon136 - 25 Feb 2020, 12:25 AM
RE: POMOC: Hadoop - DUŻE dane - by contactcrocker - 25 Feb 2020, 12:28 AM
RE: POMOC: Hadoop - DUŻE dane - by leylacafferata - 25 Feb 2020, 12:31 AM
RE: POMOC: Hadoop - DUŻE dane - by cloaked82 - 25 Feb 2020, 12:34 AM
RE: POMOC: Hadoop - DUŻE dane - by yvonnecwh - 25 Feb 2020, 12:37 AM
RE: POMOC: Hadoop - DUŻE dane - by michmex35 - 25 Feb 2020, 12:40 AM
RE: POMOC: Hadoop - DUŻE dane - by johnfrommath - 25 Feb 2020, 12:44 AM

Forum Jump:

Thread Rating:
  • 0 Vote(s) - 0 Average
  • 1
  • 2
  • 3
  • 4
  • 5


Users browsing this thread: 5 Guest(s)