1. Foren
  2. Kommentare
  3. Wissenschaft
  4. Alle Kommentare zum Artikel
  5. › Max-Planck-Institut: Maschinelles…

Der nächste logische Schritt:

  1. Thema

Neues Thema Ansicht wechseln


  1. Der nächste logische Schritt:

    Autor: honna1612 27.10.17 - 19:56

    Ich hoffe das kommt dann auch im nächsten codec VP10 oder x266 dazu um bessere kompression zu schaffen. Sobald man ja ein Netz hat dass funktioniert ist die anwendung eines Bildes ja im vergleich mit sehr wenig rechenaufwendig.

  2. Re: Der nächste logische Schritt:

    Autor: Geheimnisträger 27.10.17 - 20:27

    Ja, die Anwendung ist schneller als das Training, aber die typischen Convolutional Neural Networks sind sehr tief (haben viele Neuronenschichten) und dementsprechend sind auch viele Rechenoperationen nötig. Vor allem muss das Netz Schicht für Schicht durchgerechnet werden, sodass die Operationen an dieser Stelle nicht parallelisierbar sind. Selbst mit einer fetten Grafikkarte halte ich es für unwahrscheinlich, dass man damit in naher Zukunft 30 FPS erreicht.

    Vielleicht findet da aber auch jemand eine schlaue Abkürzung, dann wäre es wiederum denkbar.

  3. Re: Der nächste logische Schritt:

    Autor: wlorenz65 28.10.17 - 06:31

    Convolutional Networks werden in X und Y Richtung abgetastet, innerhalb eines Layers ist das also sehr gut parallelisierbar.

    Zwischen den Layern gibt es zwar noch die Latenz, die stört bei Videos aber nicht, weil die Daten ja gepuffert vorliegen. So können die Layer parallellisiert werden, indem sie das Video jeweils um einen Frame versetzt verarbeiten.

    Nur bei Echtzeitanwendungen tritt das von dir beschriebene Problem auf, also bei Videokonferenzen und Spielen.

  4. Re: Der nächste logische Schritt:

    Autor: sackzement 28.10.17 - 13:58

    Als jemand der mit laufend mit convolutional networks arbeitet kann ich da ein bisschen mehr dazu sagen:
    1. convNets sind an sich sehr gut parallelisierbar und die einzelnen convolutions lassen sich bestens GPU-beschleunigt berechnen.

    2. die latenz ist da aber bisweilen sehr gering, als ein beispiel lässt sich da ResNet50 erwähnen, aktuell eins der besten netzwerke für Klassifikation von bildern und ebenso ein relativ komplexes und tiefes netzwerk. mit einer modernen GPU (beispielsweise nvidia pascal serie etc.) lassen sich da leicht latenzen von 10-20ms erreichen, was absolut ausreichend für echtzeitvideo ist, zudem wurden schon inferenz-throughputs von über 1000 bildern/sec auf einer GPU erreicht.

    3. wenn man sich das paper zu der hier beschriebenen Methode durchliest stellt man fest dass die architektur des verwendeten netzwerkes stark an VGG angelehnt ist, was von der performance ähnlich wie ResNet ist. Zudem wird im paper die performance evaluiert, mit dem Ergebnis dass die inferenzzeit zwischen 9 und 18ms liegt (das entspräche 55-110 FPS, mit batching ließe sich vermutlich noch deutlich mehr erreichen, benchmarks von VGG kamen da mit batching auf 200-300FPS), unter verwendung einer nvidia Tesla k40 GPU (welche von der performance in etwa vergleichbar mit einer gtx1070 ist). man kann also durchaus sagen dass die verwendete Methode geeignet für videoanwendungen ist.

  5. Re: Der nächste logische Schritt:

    Autor: honna1612 28.10.17 - 22:18

    Richtig. Selbst wenn es nicht parallelisierbar wäre (was es nicht ist) kann man dafür jeden frame parallel errechnen.
    Bevor dass kommt sollten codecs aber auch mal motion prediction mit drehung um eine achse und nicht lineare bewegung (polynomfunktion) beherrschen. Wird schon langsam zeit.

  6. Re: Der nächste logische Schritt:

    Autor: bombinho 31.10.17 - 15:08

    Die Abkuerzung ist laengst bekannt ;) Datenbank und/oder spezialisierte Algorithmen, was schnelle Einblendungen bei leicht identifizierbaren Objekten/Mustern ermoeglicht. Dann zwar mit deutlichen Abstrichen, aber bei spezialisierten Anwendungsfaellen erheblich schneller.

    Hochkomplexe Algorithmen lassen sich fast immer in definierten Grenzen durch wesentlich vereinfachte Algorithmen ersetzen. Je mehr Annahmen man bereits als gegeben annehmen kann, um so staerker kann man vereinfachen.

    Abseits:
    Kompliziert wird es, wenn anhand der generierten Daten Entscheidungen getroffen werden.

  1. Thema

Neues Thema Ansicht wechseln


Um zu kommentieren, loggen Sie sich bitte ein oder registrieren Sie sich. Zum Login

Stellenmarkt
  1. Advantest Europe GmbH, Böblingen
  2. ServiceXpert Gesellschaft für Service-Informationssysteme mbH, München
  3. Deutsche Leasing AG, Bad Homburg
  4. Deutsche Rentenversicherung Bund, Berlin

Golem pur
  • Golem.de ohne Werbung nutzen

Anzeige
Spiele-Angebote
  1. 37,49€
  2. 4,65€
  3. (-35%) 25,99€


Haben wir etwas übersehen?

E-Mail an news@golem.de


Amazon, Netflix und Sky: Disney bringt 2020 den großen Umbruch beim Videostreaming
Amazon, Netflix und Sky
Disney bringt 2020 den großen Umbruch beim Videostreaming

In diesem Jahr wird sich der Video-Streaming-Markt in Deutschland stark verändern. Der Start von Disney+ setzt Netflix, Amazon und Sky gehörig unter Druck. Die ganz großen Umwälzungen geschehen vorerst aber woanders.
Eine Analyse von Ingo Pakalski

  1. Peacock NBC Universal setzt gegen Netflix auf Gratis-Streaming
  2. Joyn Plus+ Probleme bei der Kündigung
  3. Android TV Magenta-TV-Stick mit USB-Anschluss vergünstigt erhältlich

Europäische Netzpolitik: Die Rückkehr des Axel Voss
Europäische Netzpolitik
Die Rückkehr des Axel Voss

Elektronische Beweismittel, Nutzertracking, Terrorinhalte: In der EU stehen in diesem Jahr wichtige netzpolitische Entscheidungen an. Auch Axel Voss will wieder mitmischen. Und wird Ursula von der Leyen mit dem "Digitale-Dienste-Gesetz" wieder zu "Zensursula"?
Eine Analyse von Friedhelm Greis

  1. Mitgliederentscheid Netzpolitikerin Esken wird SPD-Chefin
  2. Nach schwerer Krankheit FDP-Netzpolitiker Jimmy Schulz gestorben

Schräges von der CES 2020: Die Connected-Kartoffel
Schräges von der CES 2020
Die Connected-Kartoffel

CES 2020 Wer geglaubt hat, er hätte schon alles gesehen, musste sich auch dieses Jahr auf der CES eines Besseren belehren lassen. Wir haben uns die Zukunft der Kartoffel angesehen: Sie ist smart.
Ein Bericht von Martin Wolf

  1. Smart Lock Netatmo und Yale zeigen smarte Türschlösser
  2. Eracing Simulator im Hands on Razers Renn-Simulator bringt uns zum Schwitzen
  3. Zu lange Ladezeiten Ford setzt auf Hybridantrieb bei autonomen Taxis

  1. Kickstarter: Gebundener Mars-Atlas zeigt Karten des Roten Planeten
    Kickstarter
    Gebundener Mars-Atlas zeigt Karten des Roten Planeten

    The Mars-Atlas ist ein interessantes Buch: Es zeigt detaillierte Karten vom Mars statt der Erde. Mehr als 2.000 Standorte sind darauf zu sehen. Auch eine digitale Applikation wird angeboten, auf der Hobbyforscher ein 3D-Modell des Mars erkunden können - ähnlich wie bei Google Mars.

  2. 5G: Österreich sieht sich beim Mobilfunk klar vor Deutschland
    5G
    Österreich sieht sich beim Mobilfunk klar vor Deutschland

    Das schlechteste Mobilfunknetz in Österreich sei immer noch besser als das beste Netz in Deutschland, hat Wirtschaftsministerin Margarete Schramböck behauptet. Auch Messungen bestätigen das.

  3. TLS: Netgear verteilt private Schlüssel in Firmware
    TLS
    Netgear verteilt private Schlüssel in Firmware

    Sicherheitsforscher haben private Schlüssel für TLS-Zertifikate veröffentlicht, die Netgear mit seiner Router-Firmware verteilt. Der Hersteller hatte nur wenige Tage Reaktionszeit. Die Forscher lehnen die Praktiken von Netgear prinzipiell ab, was zur Veröffentlichung geführt hat.


  1. 17:20

  2. 17:07

  3. 16:45

  4. 15:59

  5. 15:21

  6. 13:38

  7. 13:21

  8. 12:30