Daré dos límites superiores. Deje que y B sean los conjuntos dados a Alice y Bob, respectivamente, y ponga a = | A | , b = | B | , c = | A ∩ B | .ABa=|A|b=|B|c=|A∩B|
d>0ϵ>0≥1−ϵcdO((min{a,b}d)2lognlogϵ−1)O((min{a,b}d)2logmin{a,b}logϵ−1)
El protocolo es el siguiente:
Si , la parte que lo ve termina el protocolo y genera como la estimación. De lo contrario, Alice y Bob comunican y el uno al otro, y determinar que es más pequeño. Asumiré a continuación wlog que .0 a b a ≤ bd≥min{a,b}0aba≤b
Alice dibuja muestras independientes aleatoriamente uniformes , , y las envía a Bob.a i ∈ A i < tt=log(2ϵ−1)a2/(2d2)ai∈Ai<t
Bob estima como.acat|{i<t:ai∈B}|
El protocolo es correcto según los límites de Chernoff-Hoeffding: si denota la variable aleatoria indicadora del evento , entonces , , son variables iid con media . Por lo tanto,
y de manera similar para .a i ∈ B X i i < t p = c / a Pr [ a ¯ X ≤ c - d ] = Pr [ ¯ X ≤ p - dXiai∈BXii<tp=c/aPr[a ¯ X ≥c+d]
Pr[aX¯¯¯¯≤c−d]=Pr[X¯¯¯¯≤p−da]≤exp(−2(da)2t)≤ϵ2,
Pr[aX¯¯¯¯≥c+d]
Ahora, estos límites son algo inútiles si : también hay variantes de Chernoff que indican
lo que nos permitiría superar el número de muestras más pequeñas en un factor de aproximadamente . El problema es que es la cantidad que queremos aproximar, por lo tanto, no lo sabemos con anticipación. Esto puede remediarse haciendo primero un cálculo aproximado de .Pr [ ¯ X ≤ p - δ ]c≪a tpp=c/ac
Pr[X¯¯¯¯≤p−δ]Pr[X¯¯¯¯≥p+δ]≤exp(−δ22pt),≤exp(−δ23pt),δ≤p,
tpp=c/ac
Entonces, el protocolo mejorado calcula con probabilidad una aproximación aditiva de usando bits de comunicación, y bits de aleatoriedad, y se realiza de la siguiente manera (las constantes no están optimizadas):d c O ( min { a , b }≥1−ϵdcO(min{a,b}O(min{a,b}d(1+cd)lognlogϵ−1)O(min{a,b}d(1+cd)logmin{a,b}logϵ−1)
Lo mismo que arriba.
Alice extrae muestras aleatorias de y las envía a Bob.Ar=10(logϵ−1)a/dA
Bob cuenta cuántas de estas muestras pertenecen a y envía este número, , a Alice.sBs
Si , el protocolo termina con la salida .0as/r≤d/20
Alice dibuja muestras aleatorias , , y se las envía a Bob.a i ∈ A i < tt=10sa/dai∈Ai<t
Bob estima como.acat|{i<t:ai∈B}|
Sin entrar en detalles, los límites de Chernoff citados anteriormente implican que con alta probabilidad, el valor de es , en cuyo caso el protocolo no excede el costo establecido, y se calcula con alta probabilidad una buena estimación de por otra aplicación de los límites de Chernoff.s/rΘ(c/a)c