Siedemnaście lat super-komputerów i innych problemów w sejsmologii

Original: http://sepwww.stanford.edu/data/media/public/sep/jon/nrc.html

Gdzie Pochodzę z

Dostałem mój start w sejsmologii w 1960 roku w wykrywaniu jądrowej. „twas wspaniałą czasu na analizy sygnałów i teorii informacji z Wienera i Levinsona w MIT i Cooley-Tukeya FFT, i miałem młodzieńczą energię i duży budżet na światowej klasy ramy głównej. Kłopot polegał na tym, teoria ta naprawdę nie niczego wielkiego na teleseisms zrobić.

Może masz więcej wiary w fizyce niż w teorii informacji. Kiedy uczniowie przychodzą do mnie wszyscy podekscytowani fal S, muszę powiedzieć, że z jakiegoś powodu nie widzimy fal S w refleksji sejsmologii. Mam tysiące taśm magnetycznych możemy przeszukiwać. Tak więc wydaje się, fizyki nie nas też.

Inni studenci przychodzą do mnie o anizotropii. Aby długie opowiadanie, trudno jest dokonać pomiarów anizotropii żadnych przekonujących danych sejsmicznych z powierzchni.

Później tego wieczoru mogę powiedzieć, że inwersja nie działa albo. Cóż, nie znaczy to, że nie może pracować, tak, że kiedy w końcu dostać coś do pracy, to nie wyjdzie znacznie zgodnie z zamierzeniami i było strasznie dużo rozczarowań po drodze. Często kończy się słowami: „Inwersja nie działa na danych tej jakości“.

W tamtych czasach świetności analizy sygnału na teleseisms 1 Hz odkryłem niesamowitą twierdzenie. Musisz warstwową fale średnie i stromo Incydent skalarnych.Twierdzenie mówi, że „jedna strona autokorelacji sejsmogram trzęsienie ziemi jest sejsmogram refleksji. Inspirujące twierdzenie, ponieważ teoretycznie można przekonwertować sejsmogram odbicia do współczynników odbicia poprzez przewidywanie i usunięcie wszystkich wielokrotne odbicia.

Twierdzenie to nie powiodło się w praktyce zbyt. Myślę, że to nie przede wszystkim dlatego, ziemia nie jest zwykle warstwowy nośnik o częstotliwości powyżej 1 Hz.

I spadł z sejsmologii i zrobił doktorat MIT efektów elektromagnetycznych fal grawitacyjnych atmosferycznych.

Co ma mnie z powrotem do sejsmologii było konsultacji w Chevron i uczenia się o migracji sejsmogram. To było niesamowite. To jest niesamowite. Możesz zobaczyć synclines, antyklinami, pinchouts i usterek, wad, gdzie czasem piękne długość poślizgu na usterki jest oczywiste. Później, gdy mamy 3-D seismology widzieliśmy, że hałas nie było hałasu, to było naprawdę pochowany meandrów rzek, a te meandry są piękne i nikt nie ma wątpliwości co do interpretacji. Czasami nasze zdjęcia są prawie tak jasna jak obrazów medycznych.Różnica między zniechęcenia sejsmogramach eksplozji jądrowych i podniecenia z sejsmogramach poszukiwań wydaje się wynikać z ilości i rozmieszczenia źródeł i odbiorników.

W 1967 roku znalazłem poszukiwawczych seismology tak uroczy, że nawet przy cenach ropy na $ 3-4 / baryłkę, postanowiłem się sejsmolog ponownie. I skoczył z moich energii, a po kilku latach przyszedł z równania falowego w jedną stronę i różnic skończonych sposobu obrazowania migracji, który został opracowany i sprzedawany przez wielu geofizycznych firm wykonawczych. Czy mogę coś z tego? Tak, mam konsorcjum przemysłowego znany jako Stanford Exploration Project, wrzesień, który płaci dziś dla mojego 15 Ph.D. studentów, a ja nie od 1973 roku Przez lata przewodnikiem około 40 doktoraty z których większość weszła do branży napisał kolejną propozycję.

Dziś robimy większość naszej codziennej pracy na stacjach roboczych, a wcześniej mieliśmy VAX i ja pierwszy raz zakupiono komputer PDP-11 w 1976 roku, dla których mieliśmy pierwszą licencję UNIX na Stanford Campus. Mój pierwszy komputer był bardzo FPS-AP-120B, który mieliśmy na siedem lat, 1977/85. Mieliśmy złe pierwszy rok z AP. Zawsze wiedziałem, że temat uszkodzeń sprzętowych i wad oprogramowania, a w tym roku dowiedziałem się o wady dokumentacji, jak staraliśmy się dołączyć, że urządzenie do systemu UNIX. Później mieliśmy wiele wspaniałych lat z entuzjazmem studentów podejmujących mikro kod i Chainer funkcji wektorowych i zrobiliśmy kilka naprawdę wyśmienitą pracę obrazowania Ziemi. W ostatnich latach chciałem Junk AP, ale wszyscy uczniowie byli przeciwko mnie. Latem ubiegłego roku, 10 lat po odejściu naszego AP-120B, znalazłem jeden z moich byłych studentów i zapytał go: „byłem rację AP lub byli studenci prawa?“ Powiedział mi, że miałem rację. On powiedział: „w chwili, podobało nam się, że byliśmy zajęci, czuliśmy się jak byliśmy osiągnięcia czegoś.“ Teraz oczywiście wszystko, co kod jest wszystkim bezwartościowe.

Mój drugi komputer był bardzo wypukłe. Jest trwały 7 lat za. Podobnie jak AP, mamy go bardzo wcześnie. Mieliśmy pierwszy w branży naftowej, prawie miał się pierwszy sprzedawany po National Security Agency kupił pierwszy kilkunastu. Gdy kupiliśmy to bardzo wczesny modelu nie rozważyć tę nieznaną firmę wypukła się wielkim hazard, ponieważ mieliśmy około 7 przekonujących wzorców. To lepiej niż nasz VAX o czynnik około 12 i doszliśmy firma z pewnością będzie na rynku od dłuższego czasu. Inną dobrą rzeczą, oprócz prowadzenia zakurzone pokładów, wypukłe miał UNIX utrzymywane przez sprzedawcę. Whoopee! To na pewno był wielki, aby zapomnieć o zachowaniu UNIX sami.

Dziś mamy myślące maszyny CM-5. Mogliśmy wolny super komputer z innego dostawcy gdybyśmy byli w stanie zaakceptować taki, który wymagany naszym programistom, aby wiadomość odejście. Ale doszliśmy wiadomość mijania by zwolnił większość naszych badań do indeksowania. Z drugiej strony, podobało nam się pomysł kodowania równoległego Fortran. Ponad połowa moich uczniów dobrowolnie uczyć się i korzystać z równoległego Fortran. Szczególnie wysokie ciśnienie ma sprzedawca od nas prostego programu Fortran 77, fale skalarne referencyjną w jednorodnej mediów przez wyraźnych różnic skończonych. Po tygodniu lub dwóch, jego firma prowadziła program w rekordowym tempie, ale nie uzyskać właściwą odpowiedź. Obecnie istnieje duża inicjatywa SEG-DOE i od tego, co słyszę, cztery różne Super komputery dał cztery różne odpowiedzi w pierwszych czterech miesiącach wysiłku. Ich test był w zasadzie ten sam program prosty w 3-D, ale ze zmienną prędkością. Przechodząc Super komputery Wiadomość nie są dla tych z nas stara się wprowadzać innowacje. Są za bardzo profesjonalne zespoły skupiające się na jednym zadaniu, które zamierzają uruchomić niezmienione przez wiele lat.
Zadziałania

Teraz, gdy wiemy coś o moich doświadczeniach i uprzedzenia pozwól mi rozwiązać niektóre z celów tej konferencji.

Myślę, że obliczenia równoległe przyjdzie w swoim własnym tempie i sejsmolodzy nie trzeba robić nic na ten temat. Gdy jest gotowy, będziemy go używać. Mamy większe problemy, które chciałbym z tobą porozmawiać na temat, i to są rzeczy, które możemy zrobić coś i są rzeczy, które musimy zrobić razem. Myślę, że głównym problemem jest to, w jaki sposób chcą ze sobą współpracować?

Cztery czy pięć lat temu mój telefon zadzwonił i był profesorem XX, który rozpoczął się w wielką tyradę na temat prof YY, którego praca, powiedział, było atrakcyjne fascynujących konsekwencji ziemia-naukowych, ogromne dotacje, wielkich pracy dla ukończeniu studentów, jedynym problemem było , po wielu latach starań, profesor YY (i całe jego instytucja) nie byli w stanie odtworzyć dzieło prof XX. „Czy to nie wielki skandal?“ I został poproszony. Myślałem o tym przez chwilę i powiedział: „Tak, ale mam dużo większy skandal znacznie bliżej do domu. Byłem ukończeniu doktoraty w wysokości dwóch w ciągu roku od wielu lat i nie sądzę, mogę odtworzyć najbardziej tej pracy albo. „Ludzie mogą powiedzieć, „Claerbout, to siwowłosy łysiejący stary kozioł, naturalnie nie można odtworzyć, że praca“, ale ja odpowiadam, że studenci nie można łatwo odtworzyć jeden drugiego pracy albo, i często Rok później nie można nawet odtworzyć ich własna praca!

Kiedy w wrześniu zrobić niezwykle dobrą pracę, często pytam sponsorów, „Czy próbowałeś nasze najnowsze i najlepsze proces X?“Odpowiedź sponsorem jest często „Dobrze, że zajmie nam 3-4 miesiące, aby dogonić w którym zostało przerwane, a my po prostu nie mają czasu i siły roboczej.

Wszystko to doświadczenie mówi mi, że powtarzalność badania jest głęboko problemem człowieka i nigdy nie spodziewałem się, że nie będzie żadnych proste rozwiązanie technologiczne do niego. Powtarzalność jest specjalnie uciążliwe dla mnie problem z absolwentów kończących się tak często. Zazwyczaj trwa to dłużej niż rok na następny dogonić gdzie poprzedni skończył. Powtarzalność badania prześladowały mnie również próbuje pisać ładne podręczniki które obejmowały teorię, kod, dane i wyniki.

Do mojego zdziwienia, kilka miesięcy później rozwiązał problem powtarzalności badań! To było około 3 lat temu. Naprawdę nie rozwiązać go i mam zamiar powiedzieć, jak to zrobiliśmy.Rozwiązanie powstała z moich wysiłków mających na celu transfer technologii.
Transfer technologii i powtarzalność badania

Podstawowa idea powtarzalności badań jest, że do każdego podpisie rysunku w dokumencie druku musimy dołączyć wskaźnik do skryptu poleceń i katalogu komputerowego, w którym ta liczba jest tworzony.Częstą przyczyną braku powtarzalności, że ludzie tracą tę lokalizację.Sposób stawiamy w praktyce jest to zrobiliśmy mapowanie pomiędzy strukturą katalogów i dokumentów. Każda postać ma swoją nazwę.Autorka czyni strukturę katalogów w tym celu makefile dla tej nazwy rysunku.Autor używa także konwencje nazewnictwa plików, tak aby ostateczny plik fabuła i wszystkie pliki pośrednie są łatwo identyfikowane i zdejmowane przez przepisy Makefile. Po oczyszczeniu, widzimy tylko oryginalne programy, pliki parametrów i danych. Po zbudowaniu widzimy pliki pośrednie i pliki wydruku.

W inżynierii, opublikowane papier jest reklama stypendium, ale dokument elektroniczny może być sama nauka. Czterdzieści lat temu dane są „znaki ołówek na papierze“ i teorii została niektóre greckie symbole. Następnie dokumenty papierowe były odpowiednie. Nie więcej. Teraz musimy dokumentów elektronicznych.

Istnieje wiele szczegółów implementacji, że różni ludzie zrobią inaczej. Na przykład w wrześniu widzimy dokumentu wydruku na ekranie, a każdy podpis postać posiada menu nagrywania i odbudować tę kwotę, itp znajdujemy dyscyplina ta jest niewielka, to dodatkowe obciążenie na naukowca, ale po ich zrozumieć to, większość z nich jak utrzymywanie ich pracy w ten sposób. Jest to o wiele łatwiejsze niż uczenie się czegoś podobnego LaTeX.

Podjęliśmy to dalej, a teraz umieścić wiele dokumentów na dysku CD-ROM. Wykonujemy naszą 9-th dystrybucji CD-ROM w tym tygodniu. Raporty przejść do sponsorów. Książki i tezy do ogółu społeczeństwa.Płyta CD-ROM posiada 600 MB i mój podręcznik jest o 1 megabajt tekstu tak, CD-ROM, które mogą być wytwarzane za dolara, będzie posiadać wszystkie naciśnięcia klawiszy można wpisywać się przez całe życie. Myślę, że nasze płyty CD-ROM są dla nas bardzo udany wprowadzanie nowych studentów w górę bardzo szybko przyspieszyć. CD-ROM jest rozczarowujące, jednak jako medium publikacji na komputerach z systemem UNIX. Po pierwsze, nigdy nie było tam duże zapotrzebowanie na prac i raportów badawczych. Następnie, producenci nie przedstawili nam podstawowe narzędzie, które daje jej twórcom Macintosh. Nie można po prostu pop dysk kompaktowy do maszyny UNIX i kliknij na ikonę. Musisz być superużytkownika. Musisz zrobić kilka żmudnych operacji z łącza drzew. Producenci UNIX upuścił piłkę na płycie CD-ROM, więc myślę, że prawdziwa przyszłość publikacji naukowej w sieci. Szkoda jednak, bo to zajmuje bardzo dużo czasu, aby przesłać do 600MB CD-ROM na niemal każdej sieci.

OK, więc porozmawiajmy o pracy ze sobą sieci wykorzystujących. Większość z nas wie o pocztę elektroniczną i FTP (File Transfer Protocol).
Sieci WWW, Mozaika, i HTML

Czy słyszałeś o World Wide Web, Mosaic, i HTML (Hyper Text Markup Language) opracowanego w CERN (Europejskie centrum) i fizyki (Super NCSA i centrum komputerowego Illinois)? Opiszę to. Jestem prawie Początkujący ale widzę wiele grup poczynił ogromne postępy. Wyobraź sobie, katalog domowy każdej osoby o stronie tekstu w tym szczególnym języku znaczników. Przygotować to w dowolnym edytorze tekstu i niektórych instrukcji. Za pomocą programu można oglądać mozaiki tego dokumentu na ekranie. Widzisz kolorowe i podkreślone słowa. Kliknięcie na nich. Kliknięcie skacze do gdzieś w swoim dokumencie lub do innego dokumentu albo w komputerze lub do cudzego komputera. Możesz zrobić przycisk w dokumencie, aby przejść do innych dokumentów, takich jak na stronie głównej na Uniwersytecie Stanforda lub że GSA (Geological Society of America). Aby to zrobić, trzeba tylko wiedzieć, tylko ich adres. Z tych dokumentów można dotrzeć niezliczoną ilość takich dokumentów hipertekstowych na całym świecie (i wypełnić książkę adresową, jak przejść). Inni ludzie mogą dotrzeć do strony startowej, jeśli dać im swój adres. Teraz wiele osób czyni te dokumenty HTML. Musimy przyznać, że GSA wyprzedza AGU i SEG. Oceanografia jest dobrze rozwinięta HTML. Matematyczna wydaje niezorganizowany. Zapomniałem powiedzieć, że te dokumenty HTML mogą zawierać zdjęcia kolorów i wielu z nich zrobić. Wiele instytucji zrobić bardzo atrakcyjnych stron przednich. Firma Hewlett-Packard daje dobry przewodnik swoich produktów. Jeśli jeszcze nie rozpoczął przeglądanie sieci, masz dreszczyk przodu. Jesteśmy dopiero zaczynasz w mojej grupie. Możesz powiększać się i przeczytaj nasze biografie i naciśnij przycisk i zobacz nasze portrety. Planujemy umieścić w programach nauczania kursu. Widziałeś katalog uczelni, gdzie profesor musi dopchać jego opis przedmiotu na kilka linii w wąskiej kolumny tekstu? Z pojawiających HTML, te złe stare dni mijają szybko. Przyszli studenci skarżą się na brak szczegółów w naszych stronach domowych. Mam dwa podręczniki, które są teraz z druku. To jest osobista tragedia dla autora, gdy wydawca mówi: „my sprzedajemy tylko 50 z nich w roku, a teraz mamy wyczerpania zapasów, więc nie zrobi kolejny nakład.“ Planuję [12 października] wypełniony umieścić mój out-of-print podręczników na siatce, wolny, reklamowane przez World Wide Web.Dokument HTML może być Twoja osobista reklama świata, bez kosztów dla Ciebie, tak szczegółowo, jak chcesz, aby ludzie mogli patrzeć łatwiej niż w książce telefonicznej. Jestem pewien, to medium eksploduje na popularności.

Nie potrzebujemy ogromnej wyobraźni, aby zobaczyć, że możemy w końcu korzystać z sieci dystrybucji powtarzalne badania. Innymi słowy, po naciśnięciu przycisku w komputerze i chwyta postać podejmowania katalog z mojego komputera. Czy chcemy, to wystarczy, aby rozpocząć pracę nad nim? Jeśli tak, nasza wspólnota powinna rozpocząć definiowanie standard powtarzalny dokumentu.Definicja Stanford to dopiero początek. Września nie można ustawić standard, bez innych grup wprowadzających swoje sprzecznych potrzeb i pomysłów. I marzył, że jestem dyrektorem NSF i że będę wymagają badań finansowanych ze środków publicznych będzie powtarzalna w ten sposób.

Nie wspomniałam baz danych. Są to zazwyczaj zbyt duża dla sieci, ale HTML powinien być wykorzystywany do reklamowania istnienie baz danych i dystrybucji próbek z nich.
Teoria odwrotna geofizyczne

Inwersja to kolejny obszar, w którym powinniśmy być w stanie współpracować w sposób znacznie lepsze niż to, co możemy zrobić dzisiaj. Mógłbym powiedział wcześniej, że inwersja nie działa. Cóż, to, co powinienem powiedzieć, że mamy pewność, dużo rozczarowań, gdy podejmujemy tego rodzaju działalności. Podręczniki (w tym moje własne) mają zniechęcająco małą liczbę przykładów dobrej jakości.

Dwadzieścia lat temu zacząłem pracę w obrazowania sejsmicznego, około dziesięć lat temu zacząłem rozumieć związek obrazowania sejsmicznego do przemysłowego geofizycznych teorii odwrotnej. Wytłumaczę to teraz w kilku słowach.Sejsmiczne obrazu jest około miliona pikseli, o tysiąc przez tysiąc. Przestrzeń Model posiada mln parametry. Przetwórstwo przemysłowe Dane standardowe mogą być traktowane jako zbliżenie operatora odwrotnego przez adjoint, transpozycję macierzy. Uzbrojeni w tę wiedzę można się spodziewać, że wielu z nas zrobiłby osobistą fortunę, zrewolucjonizowanie branży obrazowania sejsmicznego wprowadzając inwersji. Oczywiście tak się nie stało, a ja nie mam łatwy czas wymyślanie nawet niewielkich ulepszeń. Naukowcy mogą namówić skomplikowane programy inwersji do pozornego sukcesu, ale nie jest łatwą sprawą, aby przekazać takie procesy wraz konsumentów.

Niektóre trudności z inwersji są nieodłącznie związane z bestii, dzielenie przez zero lub zbliża się w jakiś sposób z modelu kowariancji i niezawodnego programu do nieliniowej iteracji. Nigdy nie-mniej, myślę, że niektóre trudności z inwersji można przezwyciężyć przez nas pracujących razem w bardziej skutecznych sposobów i postaram się wyjaśnić, w jaki sposób.
Komputer języka C ++

Problem z Fortran jest to, że wydaje się wymagać od lekarza, aby być ekspertem w sejsmologii, jak również jest ekspertem w teorii optymalizacji.Połączenie jest zbyt trudne dla prawie każdego. Niektórzy ludzie odkryli częściowe zwolnienie od szerokiego wykorzystania Mathematica i Matlab. Podziwiam tych wysiłków, ale myślę, że musimy bardziej elastyczne połączenie między sejsmologii i nieliniowej metody optymalizacji. To, czego potrzebujemy jest sposobem na sejsmolodzy do pracy z innych ekspertów numerycznych bez żadnej z grup, która chciałaby wiedzieć dużo o tym, co druga grupa robi.Sekwencja na wywołanie programu FFT jest przykładem interfejsu pomiędzy specjalisty numerycznej i sejsmolog gdzie ani potrzeby nic wiedzieć o innych.Interfejs do inwersji jest znacznie bardziej skomplikowana niż proste Fortran sekwencji wywołującego.

To jest właśnie problem został rozwiązany przez współczesnych języków obiektowych, takich jak C ++. „Informacje ukrywa“ to nazywają. Co powinien zrobić to sejsmolog tworzą wszystkie części atomowych operatorów i wskazują, w jaki sposób operatorzy budowane są jako łańcuchy części atomowych, lub podzielonych operatorów. Co infrastruktury biblioteka C ++ powinien zrobić, to operatorom adjoint przez odwrócenie łańcuchy, przekształcenie operatorów kolumn do operatorów wierszy. Co powinien zrobić Specjalista numeryczna jest dostarczenie programów optymalizacyjnych w jakimś takim języku, informacje takie jak ukrywanie-C ++. Moja grupa zmaga się z tym w ciągu 2-3 lat, a ostatnio rozpoczęliśmy współpracę z grupą Billa Symes „na Uniwersytecie Rice. Nie są to łatwe, ale znalezienie Mamy głęboką wiarę w tym kierunku.

Moja wizja przyszłości jest to, że równolegle Fortran będzie dobrze dla tych ludzi robi przodu modelowania i tych przetwarzania danych przez dość standardowych metod, ale dla tych z nas zmaga się z rozwojem algorytmów i inwersji, coś jak C ++ będzie lepiej, ale dopiero po raz pierwszy opracować podstawowe ramy. Czy ktoś chce pomóc?
Wniosek

Podsumowując, myślę, że my, sejsmolodzy powinien omówić koncepcję powtarzalny badań, ponieważ odnosi się do sieci. Nasza wspólnota powinna rozpocząć definiowanie standard powtarzalny dokumentu.Definicja Stanford września to dopiero początek.

Kończąc, dziękuję organizatorom za poruszanie się razem i mam nadzieję, że możemy ściślej współpracować w przyszłości.

Comments are closed.