Awesome

MTMC

A paper list of Multi Target Multi Camera (MTMC) tracking and related topics including application case in: vehicle tracking :red_car: , pedestrian tracking :frowning_person: , sports player tracking :soccer: .

<details><summary>Click to show menu</summary>

<a href="#multi-target-single-camera-tracking-paper">Multi Target Single Camera Tracking Paper </a>
<a href="#multi-target-multi-camera-tracking-paper">Multi Target Multi Camera Tracking Paper </a>
<a href="#related-github-repo">Related Github Repo</a>
<a href="#related-competition">Related Competition</a>

</details>

Multi Target Single Camera Tracking Paper

2022

Observation-Centric SORT: Rethinking SORT for Robust Multi-Object Tracking, Cao et al. [paper] [code]

interesting to see a variant of SORT (observation-centered) achieve decent results

PoserNet: Refining Relative Camera Poses Exploiting Object Detections, Taiana et al. :rainbow: [paper] [code]

not tracking but seems applicable in MC-tracking, detect bbox from images and match roughly, use interesting GNN formulation to refine camera pose: image as node, edge as relative pose, bbox info added during message passing

2021

ByteTrack: Multi-Object Tracking by Associating Every Detection Box, Zhang et al. [paper] [code]

at first associate box with high detection score, then associate box with low detection score, improve tracking on occluded objects

Quasi-Dense Similarity Learning for Multiple Object Tracking, Pang et al. :rainbow: [paper] [code]

instance similarity learning based on region proposal, flexible, no external data required

TrackFormer: Multi-Object Tracking with Transformers, Meinhardt et al. [paper]

Transformer, detection and tracking simultaneously

2020

How To Train Your Deep Multi-Object Tracker, Xu et al. :rainbow: [paper]

Deep Hungarian Net, approximate MOTA, MOTP for loss function directly

Learning a Neural Solver for Multiple Object Tracking, Braso & Leal-Taixe :rainbow: [paper]

apperance embedding (node) and geometry distance embedding (edge) for graph, edge classification with cross entropy loss

Deep learning in video multi-object tracking: A survey, Ciaparrone et al. [paper]

pipeline: detection, feature extraction, affinity, association

Chained-Tracker: Chaining Paired Attentive Regression Results for End-to-End Joint Multiple-Object Detection and Tracking, Peng et al. :rainbow: [paper] [code]

end-to-end MOT, use adjacent frames (chained) to combine detection, feature extraction and tracking

2019

Spatial-Temporal Relation Networks for Multi-Object Tracking, Xu et al. [paper]

use appearance, location and topology cues for similarity score, then graph solved by Hungarian algorithm

Graph convolutional tracking, Gao et al. [paper]

GNN, Siamese network

Tracking without bells and whistles, Bergmann et al. [paper] [code]

motion and appearance extention -> Tracktor++

Deep Learning for Visual Tracking: A Comprehensive Survey, Marvasti-Zadeh et al. [paper]

traditional and deep visual trackers

A Review of Visual Trackers and Analysis of its Application to Mobile Robot, You et al. [paper]

correlation filter, deep learning and convolutional features

2018

Exploit the Connectivity: Multi-Object Tracking with TrackletNet, Wang et al. [paper]

use epipolar geometry, tracklet as node in graph

Real-time Multiple People Tracking with Deeply Learned Candidate Selection and Person Re-Identification, Chen et al. [paper][code]

online MOT tracker

2017

Multi-Object Tracking with Quadruplet Convolutional Neural Networks, Son et al. [paper]

learn statistics to normalize effect of camera poses, temporal adjacent constraint for data association

Real-Time Multiple Object Tracking, Murray. [paper]

not use appearance feature, very fast, not accurate

High-Speed Tracking-by-Detection Without Using Image Information, Bochinski et al. [paper] [code]

IoU tracker, no visual cues used, fast

Online Multi-Target Tracking Using Recurrent Neural Networks, Milan et al. [paper]

RNN as tracker, LSTM for data association

2016

Learning by tracking: Siamese CNN for robust target association, Leal-Taixe et al. [paper]

use Siamese CNN to learn similarity, for data association, graph solved by Linear Programming

2014

Learning an image-based motion context for multiple people tracking, Leal-Taixe et al. [paper]

interaction between objects, relax the dependency of tracking on detections

Multi Target Multi Camera Tracking Paper

2022

Graph Convolutional Network for Multi-Target Multi-Camera Vehicle Tracking, Luna et al. [paper]

step 1: single camera tracking & generate appearance feature, step 2: multi camera association with GNN (single camera trajectories as node, averaged feature as node feature, cos(feature) as edge feature), weighted loss for imbalance

2021

DyGLIP: A Dynamic Graph Model with Link Prediction for Accurate Multi-Camera Multiple Object Tracking, Quach et al. [paper]

tracklet as node, link prediction for data association, ok for w/wo overalaping view, use large training data

Online Clustering-based Multi-Camera Vehicle Tracking in Scenarios with overlapping FOVs, Luna et al. [paper]

detection-> feature extraction, homography -> cross-camera cluster -> incremental temporal association, small latency, not very accurate

2020

Real-time 3D Deep Multi-Camera Tracking, You & Jiang [paper]

fusion all views into ground-plane occupancy heatmap

City-Scale Multi-Camera Vehicle Tracking by Semantic Attribute Parsing and Cross-Camera Tracklet Matching, He et al. [paper]

tracklet representation with spatial-temporal attention, then tracklet-to-target assignment

Multi-Target Multi-Camera Tracking by Tracklet-to-Target Assignment, He et al. [paper] [code]

tracklet-to-target assignment

AI City Challenge 2020 – Computer Vision for Smart Transportation Applications, Chang et al. [paper]

single camera tracklet -> multi-camera tracklet fusion with appearance and physical features

Multi-Camera Tracking of Vehicles based on Deep Features Re-ID and Trajectory-Based Camera Link Models, Hsu et al. [paper]

use TrackletNet for single camera trajectory -> inter-camera tracking

ELECTRICITY: An Efficient Multi-camera Vehicle Tracking System for Intelligent City, Qian et al. [paper]

single camera tracking -> match tracklets across camera views

Pose-Assisted Multi-Camera Collaboration for Active Object Tracking, Li et al. [paper] [code]

Reinforcement learning, collaborative multi-camera

Reconstruction of 3D flight trajectories from ad-hoc camera networks, Li et al. [paper] [code]

camera synchronization, SfM, Bundle Adjustment, spline representation for drone trajectory

The MTA Dataset for Multi Target Multi Camera Pedestrian Tracking by Weighted Distance Aggregation [paper]

combine appearance and homography for hierachical clustering, known camera pose

Cross-View Tracking for Multi-Human 3D Pose Estimation at over 100 FPS, Chen et al. [paper]

2019

People tracking in multi-camera systems: a review, Iguernaissi et al. [paper]

Centralized (combine cross-camera views before tracking, like Wen et al.) and Distributed methods (single-camera tracking before fusion)

CityFlow: A City-Scale Benchmark for Multi-Target Multi-Camera Vehicle Tracking and Re-Identification, Tang et al. [paper]
Real-Time Multi-Target Multi-Camera Tracking with Spatial-Temporal Information, Zhang & Izquierdo :rainbow: [paper]

single camera detection -> create/match to track, with apperance, motion, spatial-temporal cues (cross-camera)

2018

Features for Multi-Target Multi-Camera Tracking and Re-Identification, Ristani & Tomasi [paper] [code]

tracklet -> single camera trajectory (correlation clustering) -> multi camera trajectory

Vehicle Re-Identification with the Space-Time Prior, Wu et al. [paper] [code]

single camera tracking -> CNN feature extraction -> multi camera tracking (KMeans)

2017

Multi-Camera Multi-Target Tracking with Space-Time-View Hyper-graph, Wen et al. :rainbow: [paper]

3D position for affinity computation, need know camera parameters, cross-view coupling before trajectory

2014

Persistent Tracking for Wide Area Aerial Surveillance, Prokaj & Medioni :rainbow: [paper]

two tracker (detection and regression) in parallel, measure their correspondence

2013

Hypergraphs for joint multi-view reconstruction and multi-object tracking, Hofmann et al. :rainbow: [paper] [code]

detection as node in hypergraph to find 3d reconstruction, which is node in a min-cost flow graph, solved by binary linear programming

2012

Branch-and-price global optimization for multi-view multi-target tracking, Leal-Taixé et al. [paper]

Related Github Repo

Related Dataset

Related Competition