Quina diferència hi ha entre ConvLSTM i CNN LSTM?


Resposta 1:

ConvLSTM és una variant de LSTM (Memòria a curt termini) que conté una operació de convolució dins de la cel·la LSTM. Els dos models són un tipus especial de RNN, capaç d’aprendre dependències a llarg termini.

ConvLSTM substitueix la multiplicació de matrius per operació de convolució a cada porta de la cel·la LSTM. En fer-ho, captura les característiques espacials subjacents mitjançant operacions de convolució en dades de diverses dimensions.

La diferència principal entre ConvLSTM i LSTM és el nombre de dimensions d’entrada. Com que les dades d’entrada LSTM són unidimensionals, no és adequat per a dades de seqüències espacials com ara conjunt de dades de vídeo, satèl·lit i imatge de radar. ConvLSTM està dissenyat per a les dades 3-D com a entrada.

Una CNN-LSTM és una integració d’una CNN (capes convolutives) amb un LSTM. Primer, la part CNN del model processa les dades i els resultats unidimensionals alimenten un model LSTM. Representació visual:

Exemple d'aplicació ConvLSTM:

  • https://www.researchgate.net/pub…BSAUTERMEISTER http://bsautermeister.de/researc… Detecció de l'anomalies mitjançant unitats de memòria de curta durada predictiu a llarg termini

Representació:


Resposta 2:

ConvLSTM és quan teniu el càlcul de multiplicació de la matriu de l’entrada amb la cel·la LSTM substituïda per l’operació de convolució. En canvi, CNN-LSTM són dos mòduls diferents que es combinen. La CNN és ​​una CNN regular que actua com a extractor de característiques espacials. La sortida de la CNN es multiplica per la cel·la LSTM per aprendre les característiques temporals.

Simplement dit, ConvLSTM i CNN LSTM es comporten de forma funcional quan ConvLSTM té la convolució incrustada a l'arquitectura mentre que CNN-LSTM acaben de concatenar externament els tipus de xarxes.