Limita en el tamaño del NFA más pequeño para L_k-distinct

Considere el lenguaje consiste en todas las cadenas -letter sobre modo que no haya dos letras iguales: $L_{k-distinct}$ $k$ $\Sigma$

L_{k - d i s t i n c t} := {w = σ_{1} σ_{2} . . . σ_{k} ∣ \forall i \in [k] : σ_{i} \in Σ and \forall j \neq i : σ_{j} \neq σ_{i}}

$L_{k-distinct} :=\{w = \sigma_1\sigma_2...\sigma_k \mid \forall i\in[k]: \sigma_i\in\Sigma ~\text{ and }~ \forall j\ne i: \sigma_j\ne\sigma_i \}$

Este lenguaje es finito y, por lo tanto, regular. Específicamente, si , entonces . $\left|\Sigma\right|=n$ $\left|L_{k-distinct}\right| = \binom{n}{k} k!$

¿Cuál es el autómata finito no determinista más pequeño que acepta este lenguaje?

Actualmente tengo los siguientes límites superiores e inferiores sueltos:

El NFA más pequeño que puedo construir tiene $4^{k(1+o(1))}\cdot polylog(n)$ estados.
El siguiente lema implica un límite inferior de $2^k$ estados:

Deje que $L ⊆ Σ^*$ sea un lenguaje regular. Supongamos que hay $n$ pares $P = \{ (x_i, w_i) \mid 1 ≤ i ≤ n \}$ modo que $x_i\cdot w_j \in L$ si y solo si $i=j$ . Entonces, cualquier NFA que acepte L tiene al menos n estados.

Otro límite inferior (trivial) es $log$ $n\choose k$ , que es el registro del tamaño del DFA más pequeño para el idioma.

También estoy interesado en los NFA que aceptan solo una fracción fija ( $0<\epsilon<1$ ) de $L_{k-distinct}$ , si el tamaño del autómata es menor que $\epsilon\cdot 4^{k(1+o(1))}\cdot polylog (n)$ .

Editar: Acabo de comenzar una recompensa que tuvo un error en el texto.

Quise decir que podemos asumir $k=polylog(n)$ mientras escribía $k=O(log(n))$ .

Edit2:

La recompensa terminará pronto, así que si alguien está interesado en lo que quizás sea una forma más fácil de ganarlo, considere el siguiente idioma:

$L_{(r,k)-distinct} :=\{w : w$ contiene $k$ símbolos distintos y ningún símbolo aparece más de $r$ veces $\}$ .

(es decir, $L_{(1,k)-distinct} = L_{k-distinct}$ ).

Una construcción similar a la de los comentarios proporciona un autómata de tamaño $O(e^k\cdot 2^{k\cdot log(1+r)}\cdot poly(n))$ para $L_{(r,k)-distinct}$ .

¿Se puede mejorar esto? ¿Cuál es el mejor límite inferior que podemos mostrar para este idioma?

— RB
fuente

¿Puedes describir tu NFA de límite superior?

— mjqxxxx

Todavía no puedo escribir sobre eso, ya que todavía estamos trabajando en ello y no hemos completado la prueba. En cambio, describiré un autómata mucho más simple de tamaño : Tome una familia de hash perfecta . Cada hash de este tipo es una función . Esto significa que para cada subconjunto de de tamaño como máximo , existe una función modo que asigna cada elemento del subconjunto a un número diferente. Después del hash, el alfabeto resultante tiene letras, por lo tanto, un autumaton de tamaño puede aceptar el lenguaje .

O ((2 e)^{k} * 2^{O (l o g (k))} * l o g (n))

$O((2e)^k * 2^{O(log(k))} * log(n))$

(n, k)

$(n,k)$

H

$H$

h : [n] \to [k]

$h: [n] \to [k]$

[n]

$[n]$

k

$k$

h \in H

$h\in H$

k

$k$

2^{k}

$2^k$

L_{k - d i s t i n c t}

$L_{k-distinct}$

— RB

El límite inferior da simplemente contando el número de estados en los que puede estar el NFA después de exactamente pasos. No creo que conozca ningún método de prueba que ofrezca límites significativamente mejores para el tamaño total de lo que se puede obtener que simplemente mirando lo que sucede después de pasos, para algunos . Pero aquí, por cada hay un NFA que puede estar solo en uno de estados después de exactamente estados.

(2 - o (1))^{k}

$(2-o(1))^k$

k / 2

$k/2$

t

$t$

t

$t$

t

$t$

(2 + o (1))^{k}

$(2+o(1))^k$

t

$t$

— Noam

Prueba (de mi reclamo anterior): El caso más difícil es ; elija diferentes subconjuntos aleatorios (de los símbolos alfabéticos) de tamaño exactamente cada uno y construya un NFA que tenga un estado para cada con alguna ruta que lo lleve a ser el primero símbolos son todos diferentes y están contenidos en , y tiene una ruta de aceptación si los siguientes símbolos son todos diferentes y están contenidos en el complemento de . Un argumento de conteo mostrará que whp (sobre la elección aleatoria de

t = k / 2

$t=k/2$

2^{k} \cdot p o l y (k, \log n)

$2^k \cdot poly(k, \log n)$

S_{i}

$S_i$

n

$n$

t

$t$

i

$i$

t

$t$

S_{i}

$S_i$

k - t

$k-t$

S_{i}

$S_i$

S_{i}

$S_i$ 's) este NFA de hecho aceptará todo el lenguaje deseado.

— Noam

En la construcción anterior, la forma más sencilla de construir el NFA tendrá un estado para cada posible prefijo de longitud y para cada posible sufijo de longitud . En cambio, la parte del prefijo y la parte del sufijo del NFA pueden construirse recursivamente utilizando la misma construcción aleatoria (pero ahora solo dentro de y su complemento, respectivamente) y esto daría un tamaño total .

j < t

$j < t$

j > k - t

$j > k-t$

S_{i}

$S_i$

(4 + o (1))^{k}

$(4+o(1))^k$

— Noam

Respuestas:

Esta no es una respuesta, sino un método que creo que dejaría un límite inferior mejorado. Cortemos el problema después de cartas son leídas. Denotar la familia de elemento conjuntos de por y la familia de conjuntos de elementos de por . Denote los estados que se pueden alcanzar después de leer los elementos de (en cualquier orden) mediante y los estados desde los cuales se puede alcanzar un estado de aceptación después de leer los elementos de (en cualquier orden) mediante . Necesitamos que si y solo si $a$ $a$ $[n]$ $\mathcal A$ $b=k-a$ $[n]$ $\mathcal B$ $A$ $S_A$ $B$ $T_B$ $S_A\cap T_B\ne \emptyset$ $A\cap B=\emptyset$ . Esto ya da un límite inferior para el número requerido de estados y creo que podría dar algo no trivial.

Este problema esencialmente requiere un límite inferior en el número de vértices de una hipergrafía cuyo gráfico lineal es (parcialmente) conocido. Problemas similares fueron estudiados, por ejemplo, por Bollobas y existen varios métodos de prueba conocidos que pueden ser útiles.

Actualización 03/24/2014: De hecho si el hypergraph anterior se puede realizar en vértices, entonces nosotros también consigue un protocolo de comunicación complejidad no determinista de la longitud para el sistema de disyunción con entradas de conjuntos de tamaño y (de hecho los dos los problemas son equivalentes) El cuello de botella es, por supuesto, cuando , para esto solo pude encontrar lo siguiente en el libro de Eyal y Noam: demostrado por el argumento probabilístico estándar. Desafortunadamente, no pude (todavía) encontrar límites inferiores lo suficientemente buenos para este problema, pero suponiendo que lo anterior sea nítido, daría un límite inferior $s$ $\log s$ $a$ $b$ $a=b=k/2$ $N^1(DISJ_a)\le \log \big(2^k \log_e {n\choose a}\big)$ $\Omega(2^k\log n)$ unificando los dos límites inferiores que ha mencionado.

— domotorp
fuente

Gracias @domotorp por tu respuesta. Esto se parece mucho a la prueba del lema que he usado para el límite inferior en la pregunta original, pero sin especificar los ' ' , y por lo tanto no es un límite contable. Su comentario sobre la pregunta anterior sugiere que el límite no se puede mejorar con ese método, ¿cree que esto podría mejorar?

x_{i}

$x_i$

y_{i}

$y_i$

2^{k}

$2^k$

— RB

El punto principal de mi comentario anterior fue que estas técnicas no pueden dar un límite inferior arriba . Esto es realmente lo que hace que este problema sea interesante para mí.

(2 + o (1))^{k}

$(2+o(1))^k$

— Noam

@Noam: Sea k = 2, a = b = 1. Ya entonces obtenemos un límite inferior ya que cada tiene que ser diferente.

\log n

$\log n$

S_{A}

$S_A$

— domotorp

@domotorp: El oculta un factor : Aquí está el análisis para el peor caso donde : Comience con y fijos y elija al azar un subconjunto de las letras entonces tenemos . Ahora elija tales conjuntos al azar, entonces la probabilidad de que al menos uno de ellos ocurra es . Si elegimos , obtenemos que whp es así para TODOS los conjuntos disjuntos y (de tamaño

o (1)

$o(1)$

O (k \log n)

$O(k\log n)$

a = b = k / 2

$a=b=k/2$

A

$A$

B

$B$

S

$S$

n

$n$

P r [A \subseteq S a n d B \subseteq S^{c}] = 2^{- k}

$Pr[A \subseteq S \:and\: B \subseteq S^c]=2^{-k}$

r 2^{k}

$r2^k$

1 - e x p (- r)

$1-exp(-r)$

r = O (\log (\binom{n}{k})) = O (k \log n)

$r = O(\log {n \choose k}) = O(k \log n)$

A

$A$

B

$B$

k / 2

$k/2$ ) El número total de tales en esta construcción es .

S

$S$

O (2^{k} k \log n)

$O(2^k k \log n)$

— Noam

@Noam: Lo siento pero nunca he visto un oculto en un , especialmente porque el problema también es interesante en mi opinión para . Pero tienes razón en que RB preguntó sobre .

\log n

$\log n$

o (1)

$o(1)$

k << \log n

$k<<\log n$

k = p o l y l o g n

$k=polylog n$

— domotorp

Algunos trabajos en progreso:

Estoy tratando de demostrar un límite inferior de . Aquí hay una pregunta que estoy seguro de que daría un límite inferior: encontrar el mínimo tal que exista una función que conserva la desunión, es decir, que iff . Estoy bastante seguro de que un límite inferior de implicaría casi de inmediato un límite inferior de para nuestro problema. corresponde aproximadamente al conjunto de nodos a los que puede llegar el NFA después de leer los primeros símbolos de la entrada, cuando el conjunto de estos $4^k$ $t$ $f:\{S \subseteq [n], |S|=k/2 \} \rightarrow \{0,1\}^t$ $S_1 \cap S_2 = \emptyset$ $f(S_1) \cap f(S_2) = \emptyset$ $t \ge 2k$ $2^{2k}=4k$ $f(S)$ $k/2$ $k/2$ símbolos es . $S$

Creo que la solución a esta pregunta ya podría conocerse, ya sea en la literatura sobre la complejidad de la comunicación (especialmente en los documentos que tratan el problema de la desunión; tal vez algunos argumentos de rango de matriz ayudarán), o en la literatura sobre codificaciones (por ejemplo, como esta ).

— bola de masa de mobius
fuente

Mis comentarios anteriores muestran que este enfoque no puede vencer

(2 + o (1))^{n}

$(2+o(1))^n$

— Noam