End to-end convolutional network for saliency prediction

0 likes2,087 views

The document discusses an end-to-end convolutional network, called JuntingNet, for saliency prediction, presented at the Large-Scale Scene Understanding Challenge 2015. It includes acknowledgments, related works, details on the dataset used for training, architecture, framework, and results of the saliency prediction model. The paper highlights quantitative and qualitative results from the model applied to the ISUN and Salicon datasets, along with technical specifications and training methodology.

Technology

End-to-end convolutional
network for saliency prediction
Junting Pan Xavier Giró-i-Nieto
Slides online
@DocXavi
Large-scale Scene
Understanding (LSUN)
Challenge 2015
http://bit.ly/juntingnet

2
Financial supportTechnical support
Albert Gil Josep Pujal
ACKNOWLEDGMENTS

3
LSUN SALIENCY CHALLENGE: A Déjà vu ?
John Markoff, “Scientists see promise in deep learning Programs”, The New York Times (Nov2012).
Photo: Keith Penner

4
LSUN SALIENCY CHALLENGE: A Déjà vu ?
[Mohedano’14]

6
RELATED WORK: Deep Saliency
Kümmerer, Matthias, Lucas Theis, and Matthias Bethge. "Deep Gaze I: Boosting Saliency Prediction with Feature Maps Trained on ImageNet." arXiv preprint
arXiv:1411.1045 (2014).

7
RELATED WORK: Deep Saliency
Vig, Eleonora, Michael Dorr, and David Cox. "Large-scale optimization of hierarchical features for saliency prediction in natural images." Computer Vision and
Pattern Recognition (CVPR), 2014 IEEE Conference on. IEEE, 2014.

8
RELATED WORK: Fully convolutional
Long, Jonathan, Evan Shelhamer, and Trevor Darrell. "Fully convolutional networks for semantic segmentation." Computer Vision and Pattern Recognition
(CVPR), 2015 IEEE Conference on. IEEE, 2015.

9
RELATED WORK: Image Classification
CaffeNet
ARCHITECTURE
[Khrizevsky’12]
DATA
[Deng’09]
FRAMEWORK
[Jia’14]

10
SALIENCY PREDICTION: JuntingNet
JuntingNet

11
SALIENCY PREDICTION: JuntingNet
JuntingNet
DATA
iSun [Xu’15]
SALICON [Jiang’15]

12
SALIENCY PREDICTION: Data
TRAIN VALIDATION TEST
SALICON [Jiang’15] 10,000 5,000 5,000
iSun [Xu’15] 6,000 926 2,000
CAT2000 [Borji’15] 2,000 - 2,000
MIT300 [Judd’12] 300 . -
Large
Scale

13
SALIENCY PREDICTION: JuntingNet
JuntingNet
ARCHITECTURE
[Pan’15]
DATA
iSun [Xu’15]
SALICON [Jiang’15]

15
SALIENCY PREDICTION: Architecture
End to end + regression = JuntingNet

16
SALIENCY PREDICTION: Architecture
Resize
96x96
Upsample +
filter
4608 = 48x48
2D
map

17
SALIENCY PREDICTION: JuntingNet
JuntingNet
ARCHITECTURE
[Pan’15] (soon)
DATA
iSun [Xu’15]
SALICON [Jiang’15]
FRAMEWORK
[Bergstra’10]
[Bastien’12]

18
SALIENCY PREDICTION: Framework
Tutorial by Daniel Nouri (*) on
regression for facial points for
Kaggle.
(*) Daniel Nouri, “Using convolution networks to detect facil points” (Dec 2014).
on Lasagne

19
SALIENCY PREDICTION: Training
Data augmentation with horizontal mirroring.

20
SALIENCY PREDICTION: Training
Loss function Mean Square Error (MSE)
Weight initialization Gaussian distribution
Learning rate 0.03 to 0.0001
Mini batch size 128
Training time 7h (SALICON) / 3h (iSUN)
Acceleration Sigmoid + nesterov momentum 0.9
Regularisation Maxout norm
GPU NVidia GTX 980

21
RESULTS: Qualitative (iSUN)
JuntingNetGround TruthPixels

22
RESULTS: Qualitative (iSUN)
JuntingNetGround TruthPixels

24
RESULTS: Qualitative (SALICON)
JuntingNetGround TruthPixels

25
RESULTS: Qualitative (SALICON)
JuntingNetGround TruthPixels

27
RESULTS: Publications by end of June
http://bit.ly/juntingnet

28
Thank you LSUN ! Thank you Boston !
http://bit.ly/juntingnetSlides online @DocXavi

More Related Content

Viewers also liked (12)

PPT

Twitter työkäytössäKaroliina Luoto

PDF

jQuery sans jQuerygoldoraf

PDF

LNUG - A year with AWSAndrew Clarke

PPTX

El periodico en el aula Daniele Mendonça de Chaves

PDF

Lionel Barzon III: Four Digital Skills For Your CareerLionel Barzon III

PDF

Boletin Septiembre - Destacan trabajo del CNE en procesos electorales Dra. Roxana Silva Ch.

PPT

Protecting Your SsaSets 01.07.10michael keyes

PDF

A Creative Design Agency & Printing Press KS Designers

PDF

"Machinima: Symbiosis of the Participatory Digital Culture and the Game Indus...Sherry Jones

PPTX

25 Ways to Spot a Graphic DesignerLogo Design Guru

PPT

2011년도 원광대학교 컴퓨터공학과 소개자료창여 김창여

DOC

Ley creacion escuelasLaura Marrone

Twitter työkäytössäKaroliina Luoto

jQuery sans jQuerygoldoraf

LNUG - A year with AWSAndrew Clarke

El periodico en el aula Daniele Mendonça de Chaves

Lionel Barzon III: Four Digital Skills For Your CareerLionel Barzon III

Boletin Septiembre - Destacan trabajo del CNE en procesos electorales Dra. Roxana Silva Ch.

Protecting Your SsaSets 01.07.10michael keyes

A Creative Design Agency & Printing Press KS Designers

"Machinima: Symbiosis of the Participatory Digital Culture and the Game Indus...Sherry Jones

25 Ways to Spot a Graphic DesignerLogo Design Guru

2011년도 원광대학교 컴퓨터공학과 소개자료창여 김창여

Ley creacion escuelasLaura Marrone

Similar to End to-end convolutional network for saliency prediction (20)

PDF

Deep Learning for Computer Vision: Saliency Prediction (UPC 2016)Universitat Politècnica de Catalunya

PDF

Neural Architectures for Still Images - Xavier Giro- UPC Barcelona 2019Universitat Politècnica de Catalunya

PDF

Image classification on Imagenet (D1L4 2017 UPC Deep Learning for Computer Vi...Universitat Politècnica de Catalunya

PDF

Image Classification on ImageNet (D1L3 Insight@DCU Machine Learning Workshop ...Universitat Politècnica de Catalunya

PDF

Visual Saliency Prediction with Deep Learning - Kevin McGuinness - UPC Barcel...Universitat Politècnica de Catalunya

PDF

CNNs: from the Basics to Recent AdvancesDmytro Mishkin

PDF

Deep Visual Saliency - Kevin McGuinness - UPC Barcelona 2017Universitat Politècnica de Catalunya

PDF

project work for a robust hybrid dep learningvindhucse95

PPTX

Analysis by semantic segmentation of Multispectral satellite imagery using de...Yogesh S Awate

PDF

Interactive Geovisualization of Seismic Activity Stuti Deshpande

PDF

745592main 2013 falker_presentation_chicagoClifford Stone

PPTX

Final thesis presentationPawan Singh

PDF

Deep Learning Representations for All - Xavier Giro-i-Nieto - IRI Barcelona 2020Universitat Politècnica de Catalunya

PDF

Bad Smells in Industrial Automation: Sniffing out Feature EnvySEAA 2022

PDF

Bad Smells in Industrial Automation: Sniffing out Feature EnvyRickRabiser1

PDF

AlexNet(ImageNet Classification with Deep Convolutional Neural Networks)UMBC

PDF

Underwater sparse image classification using deep convolutional neural networksMohamed Elawady

PDF

Open-ended Visual Question-AnsweringUniversitat Politècnica de Catalunya

PDF

Deep Learning for Computer Vision: ImageNet Challenge (UPC 2016)Universitat Politècnica de Catalunya

PPTX

AlexNet(ImageNet Classification with Deep Convolutional Neural Networks)UMBC

Deep Learning for Computer Vision: Saliency Prediction (UPC 2016)Universitat Politècnica de Catalunya

Neural Architectures for Still Images - Xavier Giro- UPC Barcelona 2019Universitat Politècnica de Catalunya

Image classification on Imagenet (D1L4 2017 UPC Deep Learning for Computer Vi...Universitat Politècnica de Catalunya

Image Classification on ImageNet (D1L3 Insight@DCU Machine Learning Workshop ...Universitat Politècnica de Catalunya

Visual Saliency Prediction with Deep Learning - Kevin McGuinness - UPC Barcel...Universitat Politècnica de Catalunya

CNNs: from the Basics to Recent AdvancesDmytro Mishkin

Deep Visual Saliency - Kevin McGuinness - UPC Barcelona 2017Universitat Politècnica de Catalunya

project work for a robust hybrid dep learningvindhucse95

Analysis by semantic segmentation of Multispectral satellite imagery using de...Yogesh S Awate

Interactive Geovisualization of Seismic Activity Stuti Deshpande

745592main 2013 falker_presentation_chicagoClifford Stone

Final thesis presentationPawan Singh

Deep Learning Representations for All - Xavier Giro-i-Nieto - IRI Barcelona 2020Universitat Politècnica de Catalunya

Bad Smells in Industrial Automation: Sniffing out Feature EnvySEAA 2022

Bad Smells in Industrial Automation: Sniffing out Feature EnvyRickRabiser1

AlexNet(ImageNet Classification with Deep Convolutional Neural Networks)UMBC

Underwater sparse image classification using deep convolutional neural networksMohamed Elawady

Open-ended Visual Question-AnsweringUniversitat Politècnica de Catalunya

Deep Learning for Computer Vision: ImageNet Challenge (UPC 2016)Universitat Politècnica de Catalunya

AlexNet(ImageNet Classification with Deep Convolutional Neural Networks)UMBC

More from Universitat Politècnica de Catalunya (20)

PDF

Deep Generative Learning for All - The Gen AI Hype (Spring 2024)Universitat Politècnica de Catalunya

PDF

Deep Generative Learning for AllUniversitat Politècnica de Catalunya

PDF

The Transformer in Vision | Xavier Giro | Master in Computer Vision Barcelona...Universitat Politècnica de Catalunya

PDF

Towards Sign Language Translation & Production | Xavier Giro-i-NietoUniversitat Politècnica de Catalunya

PDF

The Transformer - Xavier Giró - UPC Barcelona 2021Universitat Politècnica de Catalunya

PDF

Learning Representations for Sign Language Videos - Xavier Giro - NIST TRECVI...Universitat Politècnica de Catalunya

PDF

Open challenges in sign language translation and productionUniversitat Politècnica de Catalunya

PPTX

Generation of Synthetic Referring Expressions for Object Segmentation in VideosUniversitat Politècnica de Catalunya

PPTX

Discovery and Learning of Navigation Goals from Pixels in MinecraftUniversitat Politècnica de Catalunya

PDF

Learn2Sign : Sign language recognition and translation using human keypoint e...Universitat Politècnica de Catalunya

PDF

Intepretability / Explainable AI for Deep Neural NetworksUniversitat Politècnica de Catalunya

PDF

Convolutional Neural Networks - Xavier Giro - UPC TelecomBCN Barcelona 2020Universitat Politècnica de Catalunya

PDF

Self-Supervised Audio-Visual Learning - Xavier Giro - UPC TelecomBCN Barcelon...Universitat Politècnica de Catalunya

PDF

Attention for Deep Learning - Xavier Giro - UPC TelecomBCN Barcelona 2020Universitat Politècnica de Catalunya

PDF

Generative Adversarial Networks GAN - Xavier Giro - UPC TelecomBCN Barcelona ...Universitat Politècnica de Catalunya

PDF

Q-Learning with a Neural Network - Xavier Giró - UPC Barcelona 2020Universitat Politècnica de Catalunya

PDF

Language and Vision with Deep Learning - Xavier Giró - ACM ICMR 2020 (Tutorial)Universitat Politècnica de Catalunya

PDF

Image Segmentation with Deep Learning - Xavier Giro & Carles Ventura - ISSonD...Universitat Politècnica de Catalunya

PDF

Curriculum Learning for Recurrent Video Object SegmentationUniversitat Politècnica de Catalunya

PDF

Deep Self-supervised Learning for All - Xavier Giro - X-Europe 2020Universitat Politècnica de Catalunya

Deep Generative Learning for All - The Gen AI Hype (Spring 2024)Universitat Politècnica de Catalunya

Deep Generative Learning for AllUniversitat Politècnica de Catalunya

The Transformer in Vision | Xavier Giro | Master in Computer Vision Barcelona...Universitat Politècnica de Catalunya

Towards Sign Language Translation & Production | Xavier Giro-i-NietoUniversitat Politècnica de Catalunya

The Transformer - Xavier Giró - UPC Barcelona 2021Universitat Politècnica de Catalunya

Learning Representations for Sign Language Videos - Xavier Giro - NIST TRECVI...Universitat Politècnica de Catalunya

Open challenges in sign language translation and productionUniversitat Politècnica de Catalunya

Generation of Synthetic Referring Expressions for Object Segmentation in VideosUniversitat Politècnica de Catalunya

Discovery and Learning of Navigation Goals from Pixels in MinecraftUniversitat Politècnica de Catalunya

Learn2Sign : Sign language recognition and translation using human keypoint e...Universitat Politècnica de Catalunya

Intepretability / Explainable AI for Deep Neural NetworksUniversitat Politècnica de Catalunya

Convolutional Neural Networks - Xavier Giro - UPC TelecomBCN Barcelona 2020Universitat Politècnica de Catalunya

Self-Supervised Audio-Visual Learning - Xavier Giro - UPC TelecomBCN Barcelon...Universitat Politècnica de Catalunya

Attention for Deep Learning - Xavier Giro - UPC TelecomBCN Barcelona 2020Universitat Politècnica de Catalunya

Generative Adversarial Networks GAN - Xavier Giro - UPC TelecomBCN Barcelona ...Universitat Politècnica de Catalunya

Q-Learning with a Neural Network - Xavier Giró - UPC Barcelona 2020Universitat Politècnica de Catalunya

Language and Vision with Deep Learning - Xavier Giró - ACM ICMR 2020 (Tutorial)Universitat Politècnica de Catalunya

Image Segmentation with Deep Learning - Xavier Giro & Carles Ventura - ISSonD...Universitat Politècnica de Catalunya

Curriculum Learning for Recurrent Video Object SegmentationUniversitat Politècnica de Catalunya

Deep Self-supervised Learning for All - Xavier Giro - X-Europe 2020Universitat Politècnica de Catalunya

Recently uploaded (20)

PDF

Fl Studio 24.2.2 Build 4597 Crack for Windows Free Download 2025faizk77g

PDF

HCIP-Data Center Facility Deployment V2.0 Training Material (Without Remarks ...mcastillo49

PPTX

AUTOMATION AND ROBOTICS IN PHARMA INDUSTRY.pptxsameeraaabegumm

PDF

How Startups Are Growing Faster with App Developers in Australia.pdfIndia App Developer

PDF

Building Real-Time Digital Twins with IBM Maximo & ArcGIS IndoorsSafe Software

PPTX

UiPath Academic Alliance Educator Panels: Session 2 - Business Analyst ContentDianaGray10

PDF

Achieving Consistent and Reliable AI Code Generation - Medusa AImedusaaico

PPTX

Q2 FY26 Tableau User Group Leader Quarterly Calllward7

PDF

The Builder’s Playbook - 2025 State of AI Report.pdfjeroen339954

PDF

Agentic AI lifecycle for Enterprise Hyper-AutomationDebmalya Biswas

PDF

CIFDAQ Market Insights for July 7th 2025CIFDAQ

PPTX

Building Search Using OpenSearch: Limitations and WorkaroundsSease

PDF

Using FME to Develop Self-Service CAD Applications for a Major UK Police ForceSafe Software

PPTX

"Autonomy of LLM Agents: Current State and Future Prospects", Oles` PetrivFwdays

PDF

Python basic programing language for automationDanialHabibi2

PDF

Windsurf Meetup Ottawa 2025-07-12 - Planning Mode at Reliza.pdfPavel Shukhman

PDF

New from BookNet Canada for 2025: BNC BiblioShare - Tech Forum 2025BookNet Canada

PDF

Log-Based Anomaly Detection: Enhancing System Reliability with Machine LearningMohammed BEKKOUCHE

PDF

Timothy Rottach - Ramp up on AI Use Cases, from Vector Search to AI Agents wi...AWS Chicago

PDF

CIFDAQ Token Spotlight for 9th July 2025CIFDAQ