Después de revisar las otras respuestas y considerar los comentarios de CodeInChaos, junto con CodeInChaos aún sesgada (aunque menos), pensé en una solución final definitiva de cortar y pegar se necesitaba una . Entonces, mientras actualizaba mi respuesta, decidí hacer todo lo posible.
Para obtener una versión actualizada de este código, visite el nuevo repositorio de Hg en Bitbucket: https://bitbucket.org/merarischroeder/secureswiftrandom . Le recomiendo que copie y pegue el código de: https://bitbucket.org/merarischroeder/secureswiftrandom/src/6c14b874f34a3f6576b0213379ecdf0ffc7496ea/Code/Alivate.SolidSwiftRandom/SolidSwiftRandom.fc . el botón Raw para que sea más fácil copiar y asegurarse de tener la última versión, creo que este enlace va a una versión específica del código, no a la última).
Notas actualizadas:
- En relación con algunas otras respuestas: si conoce la longitud de la salida, no necesita un StringBuilder, y cuando usa ToCharArray, esto crea y llena la matriz (no necesita crear primero una matriz vacía)
- En relación con algunas otras respuestas: debe usar NextBytes, en lugar de obtener una por vez para el rendimiento
- Técnicamente, podría anclar la matriz de bytes para un acceso más rápido ... generalmente vale la pena cuando itera más de 6-8 veces sobre una matriz de bytes. (No hecho aquí)
- Uso de RNGCryptoServiceProvider para la mejor aleatoriedad
- El uso del almacenamiento en caché de un búfer de 1 MB de datos aleatorios : la evaluación comparativa muestra que la velocidad de acceso de bytes individuales en caché es ~ 1000 veces más rápida, lo que lleva 9 ms sobre 1 MB frente a 989 ms para el almacenamiento en caché.
- Rechazo optimizado de la zona de sesgo dentro de mi nueva clase.
Solución final a la pregunta:
static char[] charSet = "abcdefghijklmnopqrstuvwxyzABCDEFGHIJKLMNOPQRSTUVWXYZ0123456789".ToCharArray();
static int byteSize = 256; //Labelling convenience
static int biasZone = byteSize - (byteSize % charSet.Length);
public string GenerateRandomString(int Length) //Configurable output string length
{
byte[] rBytes = new byte[Length]; //Do as much before and after lock as possible
char[] rName = new char[Length];
SecureFastRandom.GetNextBytesMax(rBytes, biasZone);
for (var i = 0; i < Length; i++)
{
rName[i] = charSet[rBytes[i] % charSet.Length];
}
return new string(rName);
}
Pero necesitas mi nueva clase (no probada):
/// <summary>
/// My benchmarking showed that for RNGCryptoServiceProvider:
/// 1. There is negligable benefit of sharing RNGCryptoServiceProvider object reference
/// 2. Initial GetBytes takes 2ms, and an initial read of 1MB takes 3ms (starting to rise, but still negligable)
/// 2. Cached is ~1000x faster for single byte at a time - taking 9ms over 1MB vs 989ms for uncached
/// </summary>
class SecureFastRandom
{
static byte[] byteCache = new byte[1000000]; //My benchmark showed that an initial read takes 2ms, and an initial read of this size takes 3ms (starting to raise)
static int lastPosition = 0;
static int remaining = 0;
/// <summary>
/// Static direct uncached access to the RNGCryptoServiceProvider GetBytes function
/// </summary>
/// <param name="buffer"></param>
public static void DirectGetBytes(byte[] buffer)
{
using (var r = new RNGCryptoServiceProvider())
{
r.GetBytes(buffer);
}
}
/// <summary>
/// Main expected method to be called by user. Underlying random data is cached from RNGCryptoServiceProvider for best performance
/// </summary>
/// <param name="buffer"></param>
public static void GetBytes(byte[] buffer)
{
if (buffer.Length > byteCache.Length)
{
DirectGetBytes(buffer);
return;
}
lock (byteCache)
{
if (buffer.Length > remaining)
{
DirectGetBytes(byteCache);
lastPosition = 0;
remaining = byteCache.Length;
}
Buffer.BlockCopy(byteCache, lastPosition, buffer, 0, buffer.Length);
lastPosition += buffer.Length;
remaining -= buffer.Length;
}
}
/// <summary>
/// Return a single byte from the cache of random data.
/// </summary>
/// <returns></returns>
public static byte GetByte()
{
lock (byteCache)
{
return UnsafeGetByte();
}
}
/// <summary>
/// Shared with public GetByte and GetBytesWithMax, and not locked to reduce lock/unlocking in loops. Must be called within lock of byteCache.
/// </summary>
/// <returns></returns>
static byte UnsafeGetByte()
{
if (1 > remaining)
{
DirectGetBytes(byteCache);
lastPosition = 0;
remaining = byteCache.Length;
}
lastPosition++;
remaining--;
return byteCache[lastPosition - 1];
}
/// <summary>
/// Rejects bytes which are equal to or greater than max. This is useful for ensuring there is no bias when you are modulating with a non power of 2 number.
/// </summary>
/// <param name="buffer"></param>
/// <param name="max"></param>
public static void GetBytesWithMax(byte[] buffer, byte max)
{
if (buffer.Length > byteCache.Length / 2) //No point caching for larger sizes
{
DirectGetBytes(buffer);
lock (byteCache)
{
UnsafeCheckBytesMax(buffer, max);
}
}
else
{
lock (byteCache)
{
if (buffer.Length > remaining) //Recache if not enough remaining, discarding remaining - too much work to join two blocks
DirectGetBytes(byteCache);
Buffer.BlockCopy(byteCache, lastPosition, buffer, 0, buffer.Length);
lastPosition += buffer.Length;
remaining -= buffer.Length;
UnsafeCheckBytesMax(buffer, max);
}
}
}
/// <summary>
/// Checks buffer for bytes equal and above max. Must be called within lock of byteCache.
/// </summary>
/// <param name="buffer"></param>
/// <param name="max"></param>
static void UnsafeCheckBytesMax(byte[] buffer, byte max)
{
for (int i = 0; i < buffer.Length; i++)
{
while (buffer[i] >= max)
buffer[i] = UnsafeGetByte(); //Replace all bytes which are equal or above max
}
}
}
Para el historial: mi solución anterior para esta respuesta, utilizaba un objeto aleatorio:
private static char[] charSet =
"abcdefghijklmnopqrstuvwxyzABCDEFGHIJKLMNOPQRSTUVWXYZ0123456789".ToCharArray();
static rGen = new Random(); //Must share, because the clock seed only has Ticks (~10ms) resolution, yet lock has only 20-50ns delay.
static int byteSize = 256; //Labelling convenience
static int biasZone = byteSize - (byteSize % charSet.Length);
static bool SlightlyMoreSecurityNeeded = true; //Configuration - needs to be true, if more security is desired and if charSet.Length is not divisible by 2^X.
public string GenerateRandomString(int Length) //Configurable output string length
{
byte[] rBytes = new byte[Length]; //Do as much before and after lock as possible
char[] rName = new char[Length];
lock (rGen) //~20-50ns
{
rGen.NextBytes(rBytes);
for (int i = 0; i < Length; i++)
{
while (SlightlyMoreSecurityNeeded && rBytes[i] >= biasZone) //Secure against 1/5 increased bias of index[0-7] values against others. Note: Must exclude where it == biasZone (that is >=), otherwise there's still a bias on index 0.
rBytes[i] = rGen.NextByte();
rName[i] = charSet[rBytes[i] % charSet.Length];
}
}
return new string(rName);
}
Actuación:
- SecureFastRandom : primera ejecución única = ~ 9-33 ms . Imperceptible. En curso : 5 ms (a veces sube hasta 13 ms) en más de 10,000 iteraciones, con una única iteración promedio = 1.5 microsegundos.. Nota: Requiere generalmente 2, pero ocasionalmente hasta 8 actualizaciones de caché; depende de cuántos bytes individuales superen la zona de sesgo
- Aleatorio : primera ejecución única = ~ 0-1 ms . Imperceptible. En curso : 5 ms en más de 10,000 iteraciones. Con una sola iteración promedio = .5 microsegundos. . Sobre la misma velocidad.
También echa un vistazo a:
Estos enlaces son otro enfoque. El almacenamiento en búfer se podría agregar a esta nueva base de código, pero lo más importante fue explorar diferentes enfoques para eliminar el sesgo y comparar las velocidades y las ventajas y desventajas.