Definição
$sortByCount
Agrupa documentos recebidos com base no valor de uma expressão especificada e, em seguida, calcula a contagem de documentos em cada grupo distinto.
Cada documento de saída contém dois campos: um campo
_id
contendo o valor de agrupamento distinto e um campocount
contendo o número de documentos pertencentes a esse agrupamento ou categoria.Os documentos são ordenados por
count
em ordem decrescente.O estágio
$sortByCount
tem a seguinte forma de protótipo:{ $sortByCount: <expression> } CampoDescriçãoexpression
Agrupamento por expressão. Você pode especificar qualquer expressão, exceto um literal de documento.
Para especificar um caminho do campo, prefixe o nome do campo com um cifrão
$
e coloque-o entre aspas. Por exemplo, para agrupar pelo campoemployee
, especifique"$employee"
como a expressão.{ $sortByCount: "$employee" } Embora não seja possível especificar um literal de documento para a agrupar por expressão, você pode, no entanto, especificar um campo ou uma expressão que seja avaliado como um documento. Por exemplo, se
employee
osbusiness
campos e forem campos de documento , a seguinte$mergeObjects
expressão , que avalia para um documento, será um argumento válido$sortByCount
para:{ $sortByCount: { $mergeObjects: [ "$employee", "$business" ] } } No entanto, o exemplo a seguir com a expressão literal de documento é inválido:
{ $sortByCount: { lname: "$employee.last", fname: "$employee.first" } }
Considerações
$sortByCount
e restrições de memória
A partir do MongoDB 6.0, os estágios do pipeline que exigem mais de 100 megabytes de memória para execução gravam arquivos temporários no disco por padrão. Esses arquivos temporários duram durante a execução do pipeline e podem influenciar o espaço de armazenamento na sua instância. Em versões anteriores do MongoDB, você deve passar { allowDiskUse: true }
para find
individuais e comandos aggregate
para habilitar esse comportamento.
Somente find
e aggregate
comandos podem substituir o parâmetro allowDiskUseByDefault
por um ou outro:
Usando
{ allowDiskUse: true }
para permitir a gravação de arquivos temporários no disco quandoallowDiskUseByDefault
estiver definido comofalse
Usando
{ allowDiskUse: false }
para proibir a gravação de arquivos temporários no disco quandoallowDiskUseByDefault
estiver definido comotrue
Observação
Para o MongoDB Atlas, é recomendável configurar o auto-scaling de armazenamento para evitar que queries de longa duração preencham o armazenamento com arquivos temporários.
Se o Atlas cluster usar auto-scaling de armazenamento, os arquivos temporários podem fazer com que o cluster seja dimensionado para o próximo nível de armazenamento.
Para obter mais detalhes, consulte Limites do pipeline de agregação.
Comportamento
O estágio $sortByCount
é equivalente à seguinte sequência $group
+ $sort
:
{ $group: { _id: <expression>, count: { $sum: 1 } } }, { $sort: { count: -1 } }
Exemplos
Considere uma coleção exhibits
com os seguintes documentos:
db.exhibits.insertMany( [ { _id: 1, title: "The Pillars of Society", artist: "Grosz", year: 1926, tags: [ "painting", "satire", "Expressionism", "caricature" ] }, { _id: 2, title: "Melancholy III", artist: "Munch", year: 1902, tags: [ "woodcut", "Expressionism" ] }, { _id: 3, title: "Dancer", artist: "Miro", year: 1925, tags: [ "oil", "Surrealism", "painting" ] }, { _id: 4, title: "The Great Wave off Kanagawa", artist: "Hokusai", tags: [ "woodblock", "ukiyo-e" ] }, { _id: 5, title: "The Persistence of Memory", artist: "Dali", year: 1931, tags: [ "Surrealism", "painting", "oil" ] }, { _id: 6, title: "Composition VII", artist: "Kandinsky", year: 1913, tags: [ "oil", "painting", "abstract" ] }, { _id: 7, title: "The Scream", artist: "Munch", year: 1893, tags: [ "Expressionism", "painting", "oil" ] }, { _id: 8, title: "Blue Flower", artist: "O'Keefe", year: 1918, tags: [ "abstract", "painting" ] } ] )
A operação a seguir aplica o comando unwinds
na array tags
e usa o estágio $sortByCount
para contar o número de documentos associados a cada tag:
db.exhibits.aggregate( [ { $unwind: "$tags" }, { $sortByCount: "$tags" } ] )
A operação retorna os seguintes documentos, ordenados em ordem decrescente por contagem:
[ { _id: "painting", count: 6 }, { _id: "oil", count: 4 }, { _id: "Expressionism", count: 3 }, { _id: "Surrealism", count: 2 }, { _id: "abstract", count: 2 }, { _id: "woodblock", count: 1 }, { _id: "woodcut", count: 1 }, { _id: "ukiyo-e", count: 1 }, { _id: "satire", count: 1 }, { _id: "caricature", count: 1 } ]
Os exemplos de C# nesta página utilizam o banco de dados sample_mflix
a partir dos conjuntos de dados de amostra do Atlas. Para saber como criar um cluster MongoDB Atlas gratuito e carregar os conjuntos de dados de exemplo, consulte Introdução na documentação do driver MongoDB .NET/C#.
A seguinte classe Movie
modela os documentos na collection sample_mflix.movies
:
public class Movie { public ObjectId Id { get; set; } public int Runtime { get; set; } public string Title { get; set; } public string Rated { get; set; } public List<string> Genres { get; set; } public string Plot { get; set; } public ImdbData Imdb { get; set; } public int Year { get; set; } public int Index { get; set; } public string[] Comments { get; set; } [ ] public DateTime LastUpdated { get; set; } }
Observação
Pacote de Convenções para Caso Pascal
As classes C# nesta página usam maiúsculas e minúsculas Pascal para seus nomes de propriedade , mas os nomes de campo na coleção MongoDB usam camel case. Para contabilizar esta diferença, você pode utilizar o seguinte código para registrar um ConventionPack
quando seu aplicação iniciar:
var camelCaseConvention = new ConventionPack { new CamelCaseElementNameConvention() }; ConventionRegistry.Register("CamelCase", camelCaseConvention, type => true);
Para usar o driver MongoDB .NET/C# para adicionar um estágio $sortByCount
a um pipeline de agregação, chame o método SortByCount() em um objeto PipelineDefinition
.
O exemplo a seguir cria um estágio de pipeline que agrupa os Movie
documentos recebidos pelo valor de seu campo Rated
e, em seguida, retorna o número de documentos em cada grupo:
var pipeline = new EmptyPipelineDefinition<Movie>() .SortByCount(m => m.Rated);